首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

服务学术共同体创新全链路,清华大学温江涛团队推出新一代科技创新评价支撑平台「Phocus」

可以看到,基于引用行为而不是引用内容方式模型并不能准确评价成果价值,且论文级模型粒度无法准确跟踪研究成果。长此以往,甚至还会导致经典固化现象,影响新一批 idea 涌现。...此外,Phocus 结合论文引用总数量、每句引用数量、作者重叠参考文献数量等因素,将引文粗略划分为 4 类,对论文中所有参考文献进行排序,结合分类结果排序得到针对一篇论文某个参考文献局部影响因子...引用文献全局影响因子是引用文献局部影响因子总影响因子乘积。 打破唯被引量论关键在于考虑作者对被引文献情感倾向去评估被引文贡献。在一篇论文中,各个参考文献贡献是不同。...基于情感引用文字分析 分析作者对一篇引文情感,可以考虑引文上下文环境。在下图中,黑色句子为引文所在句子,绿色句子为引文前文,黄色为引文后文。...这部分会依托于核心 CSI-index 打包出多个功能模块,包括依据新影响力评价系统,生成各领域各学科影响力指数,热门趋势预测报告,生成能广泛引发讨论问题、多媒体等等。

33510

区块链技术介绍

本文作者:南小芽[1] 区块链到底是什么? 比特币正在不断突破记录,但区块链技术肯定包含了除加密技术之外更多东西,不是吗?好了,我们先来看看底层技术,了解它实际上为我们提供了什么。...谁也无法阻止网站所有者修改他们数据库中信息或从他们记录中删除信息。如果 Twitter 出于某种原因决定你一条不应该存在,他们可以删除它(你也可以)。这同样适用于所有其他社交网络其他一切。...为了在所有客户端之间建立信任,或者换句话说,为了确保没人能轻而易举地修改链并向您客户端发送一个假链,区块中会包含一个加密引用。...这个引用通常会考虑当前区块前一个区块内容,这样就可以验证一个区块整个链正确性。 根据实际区块链实现,将一个新区块添加到链中过程可以称为挖矿或者铸造。 链本身被设计成不可变。...离开之前 如果你喜欢这篇文章,请访问我Twitter[2]。我经常以多种形式在那里发布内容,比如线程或简单提示

2.8K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Academic social networks: Modeling, analysis, mining and applications 2019翻译

    我们可以从书目数据库中获取这些实体,这些数据库包含有关出版物(如作者、所属单位、页数、年份)及其引用出版物(如引用参考文献、引用次数)元数据。图2显示了典型实体及其关系。 **图2。...图3a是合作作者网络,其中XY共同撰写论文A论文E,YZ共同撰写论文C。图3b是引文网络,其中论文通过直接引文链接连接。先发表论文被后发表论文引用,即先发表论文向后发表论文划出箭头。...一般来说,学者从书目数据库中提取信息,构建论文作者网络。这些网络包含异质信息,包括文章、作者、共引等。通过分析论文-作者网络,可以探索显性隐性引用关系。...TreeratpitukGiles(2009)使用随机森林模型,通过考虑作者姓名、隶属关系、合作者相关因素来消除名称歧义。...Eysenbach(2011)利用特预测一篇论文在发表后头30天内是否能被频繁引用

    73930

    马斯克高调晒图:SpaceX首批60颗互联网卫星将于本周入轨

    所配图片可以看出,即将发射60颗卫星全部由猎鹰9号火箭运载,它们集中在火箭前端,将一次性发射进入太空。 ? 据了解,本周发射60颗卫星为SpaceX“星链计划”中首批运营卫星。...不过FCC尚未完全批准这项计划,一切都取决于SpaceX能否在未来6年内将一半卫星发射升空并顺利进入预定轨道。...要知道,不加上本周发射60颗卫星,SpaceX只在去年2月发射了该计划中两颗卫星,分别为测试卫星TinTin ATinTin B。...而该公司也正是基于这两颗卫星收集数据信息,才成功让FCC批准其让部分卫星升空。...马斯克表示,不同于TinTin卫星,即将发射60颗量产卫星为“示范”卫星,即拥有与地球通信天线和在太空中机动能力,但无法在轨道上彼此通信。

    31020

    把握春招,收下这份GitHub万星ML算法面试大全!

    后一部分基本算法就非常多了,从最简单 Logistic 回归到复杂梯度提升树,这一部分总结了主流机器学习算法: 信息论 逻辑斯蒂回归 支持向量 决策树 集成学习 梯度提升决策树 GBDT 随机森林...最后机器学习还有一个关于集成方法专题。除了支持向量,集成方法相关问题在 ML 中也比较重要,因为像 XGboost 随机森林等方法在传统 ML 中效果应该是顶尖,被问到概率也大得多。 ?...顶多会让我们手一个反向传播算法,不会像手支持向量那样让我们从表达式一下卷积网络。...项目作者主要为面试准备了以下几方面的知识点: 概率论 微积分本质 深度学习核心 其中深度学习核心主要包含非线性激活函数、梯度下降反向传播。...如下所示为解题代码,注意基本上各基础算法题解都是用 C++写作者引用剑指 Offer 题解 Leetcode 题解等解决方案。

    78350

    PubMed专题:(二)搜索结果阅读、筛选、下载、保存与利用

    期刊IF(很重要一点,IF过低,不排除会被质疑可能) 4. 文献附带资源(是否有基因测序数据等等) 5. 文献研究类型(单纯meta分析,还是随机对照实验?)等。...放“简单操作,Firefox让PubMedJCR分区、IF、引用数尽显,文献秒下”连接 3. 保存并导出您搜索 PubMed又一个很酷功能——保存搜索功能。...此功能允许您保存,组织导出搜索结果。有多种方法可以保存您搜索: ?...您已成功将引文从PubMed导出,并准备将其导入EndNote。 第2部分 导入EndNote ? 01 ? 转到EndNote并打开要存储引用库。 ? 02 ? 单击文件菜单,然后选择导入>文件。...这将导入除重复之外所有引用。 ? 06 ? 完成后单击“ 导入”。 ? 那么,你在PubMed中引用现在应该在您Endnote库中。

    2.2K50

    PubMed专题:(二)搜索结果阅读、筛选、下载、保存与利用

    期刊IF(很重要一点,IF过低,不排除会被质疑可能) 4. 文献附带资源(是否有基因测序数据等等) 5. 文献研究类型(单纯meta分析,还是随机对照实验?)等。...放“简单操作,Firefox让PubMedJCR分区、IF、引用数尽显,文献秒下”连接 3. 保存并导出您搜索 PubMed又一个很酷功能——保存搜索功能。...此功能允许您保存,组织导出搜索结果。...您已成功将引文从PubMed导出,并准备将其导入EndNote。 第2部分 导入EndNote 01 转到EndNote并打开要存储引用库。 02 单击文件菜单,然后选择导入>文件。...这将导入除重复之外所有引用。 06 完成后单击“ 导入”。 那么,你在PubMed中引用现在应该在您Endnote库中。

    5.1K00

    Android逆向 | 基础知识篇 - 01

    散列后不可逆 一般用于校验数据完整性、签名 sign 由于密不可逆,所以后台无法还原,也就是说他要验证,会在后台以跟前台一样方式去重新签名一遍。...也就是说他会把源数据签名后值一起提交到后台。...,只有使用私钥配对公钥才能解密该文件 MANIFEST.MF:程序清单文件,他包含包中所有文件摘要明文 resource.arsc:资源加密(语言包)对res目录下资源一个索引文件,保存了原工程中...res目录下资源文件在编译时会自动生成索引文件(R.java),在java代码中用R.xxx.yyy来引用 asset目录下资源文件不需要生成索引,在java代码中需要用AssetManager中访问...Dalvik是google专门为安卓操作系统设计一个虚拟,经过深度优化,虽然安卓上程序是使用java来开发,但是Dalvik标准java虚拟JVM还是两回事,Dalvik VM是基于寄存器

    1.1K40

    大清朝微积分教材,堪称天书!

    是的,清朝数学家李善兰将国外微积分课本直接翻译成了文言,供人们参考学习。 快看看,什么叫文言+微积分双重酸爽。这酸爽,才够味!...原则,就会发现, 上面的式子一模一样。...上引文提及之天算家依序为董佑城、项名达、徐有壬、戴煦、顾观光以及李善兰,都是十九世纪中国清代数学名家。不过,由于「不用代数式」,所以文章显得「言之甚繁,之甚难」。...在Karl Weierstrass分析算术化(arithmetization of analysis)提出极限ε−δ定义之前,是无法解决。...p=25200 本文引用了以下知乎作者文章: 「zdr0」https://zhuanlan.zhihu.com/p/437864462 对比Excel系列图书累积销量达15w册,让你轻松掌握数据分析技能

    1K20

    搞定基本cellranger定量

    得到3个fq文件,其实这后面还需要修改一下名字 R1就是barcode+UMI序列 质控 使用原代码 单细胞实战(三) Cell Ranger使用初探 # 以P2586-4为例 mkdir...单细胞实战(三) Cell Ranger使用初探 原cellranger版本已经较老了,这里我去官网下载最新版: https://support.10xgenomics.com/single-cell-gene-expression...来处理这些不同情况 主要根据sample、library、flowcell数量来定义分析复杂程度(由浅入深) 原提到,这些不同情况也有不同fq文件位置需要注意,这里我们就不深入探究了 我们这里主要使用最新版...cellranger7.1.0软件对fq文件进行定量,同时与作者当时使用v2版本输出文件结果进行比较 原v2版本代码: 我使用最新版定量代码: ref=.....Browser 输入文件 此外,原还提到了一些内置软件算法、如何自主构建参考信息以及多个文库整合 aggr 很多时候,我们需要根据自己需要,自定义一套参考信息 当处理多个生物学样本或者一个样本存在多个重复

    1.2K41

    将 PDF 转化为 Word 文件

    ,来自[2]: paslt.tex:输入 LaTeX 文件名 -o output.docx:输出 Word 文件名 -w docx:输出文件格式 --reference-doc template.docx...:参考模板 Docs 文件 【可选】 --filter pandoc-crossref:用于交叉引用(公式、引文过滤器 【可选】,下载地址:GitHub[3],必须找到与已安装 pandoc 版本对应可执行文件...,下载后放在运行此命令同一目录下(对于 Windows macOS) --bibliography ref.bib:参考文献 bib 文件 【可选】 --citeproc:用于参考文献引用 【可选...可能很多读者是通过 R 语言关注我,但是最近发内容主要是平常科研存在小技巧科研者成长相关内容。...[2] : https://blog.csdn.net/qq_31375855/article/details/122044004 [3] GitHub: https://github.com/lierdakil

    1.7K30

    如何免费获得高质量标注数据?

    看过之后,大多数人都觉得科斯观点令人无法接受,自然也是撰文大加鞭挞。 可问题是,新写出来文章末尾,还是要把科斯这篇论文当做引文。 这篇文章,读过的人越来越多,科斯名气也就越来越大。...标注工作做了几年,也就是完成了百十来篇文献分析,包含几千条引文目的标注。成本已经高到令人咂舌了。 这显然不是个好办法。...人们想当然认为,作者们都是富有研究经验学者,因此时间更加宝贵。不太可能回应这种需求。 他们要是收费的话,会比目前标注人员更高。标注需求一方科研经费更加无法支撑。 这个假设,看似正确。...Petr 于是就想,如果我可以让作者在网页上方便地一站式看到上下文、文献记录引用目的选项,那这项标注工作繁琐程度是不是就大大减低了呢?...有了这个系统之后,他们随机选择了数千篇论文,自动抓取了第一作者联系邮箱,然后把请求和对应论文标注页面的链接发送了过去。

    1K20

    全网最全!EEG脑电公开数据库大盘点

    在大数据时代,数据库开放共享已逐渐成为研究领域趋势之一,目前很多国外期刊杂志也鼓励投稿者共享开放研究数据。笔者很久以前写过一篇类似的(《值得收藏!...EEG/ MEG/MRI/ fNIRS公开数据库大盘点》),但最近笔者又搜罗了不少EEG公开数据库网站,因此在这篇里笔者把目前EEG公开数据库进行了较为全面的总结,希望对大家有所帮助。...网址:http://crcns.org/data-sets 14.Zenodo Zenodo是一个开放数据共享平台,平台里面可以共享任何科研数据、软件代码等,数据可以免费下载,当然里面也包含不少EEG...,平台里面可以共享任何科研数据、软件代码等,里面包含不少EEG数据。...Harvard Dataverse Harvard Dataverse是一个免费数据存储库,向来自哈佛社区内外任何学科所有研究人员开放,您可以在其中共享、存档、引用、访问探索研究数据。

    2.1K20

    操作系统:第七章 文件管理

    变长记录建立索引表后,索引表是定长记录顺序文件,就可以把对变长记录顺序文件顺序检索变为对定长记录索引文随机检索。 2....、 7.3.1 文件控制块索引结点 为了能对一个文件进行正确存取,必须为文件设置用于描述控制数据结构,称之为”文件控制块(FCB)” 文件管理程序可借助于文件控制块中信息对文件施以各种操作...在主文件目录中每个用 户目录文件都占有一个目录项,其中包括用户名指向该用户指针。...不同用户还可以使用不同文件名来访问系统中同一个共享文件。 存在问题是:各用户之间被完全隔离了,无法进行合作。...此时该文件系统目录结 构已不再是树型结构,而是个有向非循环图。 如果通过在文件目录中包含文件物理地址方法实现共享有很 多缺陷。故采用基于索引结点共享方式。

    1.1K10

    MySQL存储文件组成常见相关问题

    当创建一张innodb表后,会在相应库目录下生成表frm文件、表数据引文件。...开启了binlog后,binlog中包含了所有数据修改信息,但binlog仅能查到什么时候修改了哪条数据,无法记录ip来源登录用户信息。...- 对MyISAM引擎来说,index_lengthdata_length为表索引文件、数据文件字节大小 - 对Innodb引擎来说,index_lengthdata_length为表索引近似字节数...整个数据库存储占用空间除了业务库目录文件大小外,还需要加上binlog、error log、redo log系统自带库表innodb共享表空间等占用大小。...内部临时表创建条件: - group by order by中列不相同 - order by列不是引用from表列表中第一个表(驱动表) - group by列不是引用from表列表中第一个表

    1.6K30

    SIGIR 2021 | UPFD:用户偏好感知假新闻检测

    对于用户节点,提取其最近200条,然后利用预训练好word2vecBERT对进行编码,然后平均以得到用户偏好嵌入向量。对于新闻节点,同样得到其嵌入向量表示。...为了获得丰富历史信息用于用户偏好建模,本文对每个账号最近200条进行了抓取,总共抓取了近2000万条。...因此,本文在可访问用户文中进行随机抽样,以组成这些无法被访问用户历史。 为了对新闻文本信息用户偏好进行编码,本文采用了两种基于语言预训练文本表示学习方法。...对于BERT模型,由于BERT输入序列长度限制,无法使用BERT将200条编码为一个序列,因此将每条单独编码,然后平均,得到一个用户偏好表示,最后,同样利用BERT模型得到新闻语料嵌入表示...不过值得注意是,得到上面两组嵌入表示后,作者并未提到怎么将两组嵌入进行融合以得到最终嵌入。

    1.2K20

    联邦学习 OR 迁移学习?No,我们需要联邦迁移学习

    最后,该框架要求所有参与方在同一个特征空间中拥有数据,这使得在实际场景中不同参与方可能无法共享完全相同特征空间。...作者在此基础上,讨论了 FTL 两种替代结构:第一种是利用附加同态加密(HE)确保安全性,第二种是利用基于 beaver 三元组共享以保证隐私性。...基于同态加密 FTL。 【密共享】 假设任何私有值 v 在 A B 双方之间共享,其中 A 保留 A,B 保留 B,因此 v=A+B。...作者在实验中对基本 FTL(TLL)、基于同态加密 FTL(TLT)、基于密共享 FTL(SST)进行了对比。...密共享方法优点是没有精度损失,计算速度也较快,但其主要缺点是需要离线生成存储多个三元组才能执行在线联邦学习。

    98330

    我暗恋了6周帅哥,竟然是一个AI机器人...

    为了简化原创内容制作,Kevin只制作两种内容:基本对热门话题评论。 每次Kevin检查Twitter时,他会分析数百条,并建立起常用词统计模型。...然后Kevin随机选择一个起始单词,并使用模型来确定下一个单词,不断重复,直到完成一个完整。这个被称为马可夫链过程可以用于创建Kevin原创内容。...其他互动则更加积极一些: 仍有改进空间 Kevin离真正成功还有很远距离。他存在着一些缺陷,由于我技能限制或着时间限制,无法进行完善。 低质量 有时,Kevin真的不擅长发。...当我细细检查这个错误时,我发现原来是随机将单词串在一起可能会导致意思与原意相反。 例如,Kevin查看了这两条: 然后撰写了这条: 从语法角度来看,这的确是一个好。...不完整想法 如果Kevin查看了一些包含链接或照片引用,他有时会发出不附有相关内容。结果就呈现了一个不完整,读者点击链接时链接是没有反应。 有时,他也会撰写没有结束

    1.1K110

    ChatGPT要把数据标注行业干掉了?比人便宜20倍,而且还更准

    我们知道,语言大模型(LLM)在规模到达一定程度之后可以「涌现」—— 即获得此前无法预料新能力。...这些由训练有素注释者(研究助理)标记为五种不同任务:相关性、立场、主题两种框架检测。...实验过程 研究人员使用了包含 2382 条数据集,这些是之前针对内容审核相关任务研究手动注释。...为了探索控制输出随机程度 ChatGPT 温度参数影响,这里使用默认值 1 0.2 进行注释,这意味着随机性较小。对于每个温度值,研究人员进行了两组注释来计算 ChatGPT 编码器协议。...为了计算 ChatGPT MTurk 准确性,对比只考虑了两个训练有素注释者都同意

    55320

    秋招准备,这份GitHub万星ML算法面试大全请收下

    后一部分基本算法就非常多了,从最简单 Logistic 回归到复杂梯度提升树,这一部分总结了主流机器学习算法: 信息论 逻辑斯蒂回归 支持向量 决策树 集成学习 梯度提升决策树 GBDT 随机森林...最后机器学习还有一个关于集成方法专题。除了支持向量,集成方法相关问题在 ML 中也比较重要,因为像 XGboost 随机森林等方法在传统 ML 中效果应该是顶尖,被问到概率也大得多。 ?...顶多会让我们手一个反向传播算法,不会像手支持向量那样让我们从表达式一下卷积网络。...项目作者主要为面试准备了以下几方面的知识点; 概率论 微积分本质 深度学习核心 其中深度学习核心主要包含非线性激活函数、梯度下降反向传播。...如下所示为解题代码,注意基本上各基础算法题解都是用 C++写作者引用剑指 Offer 题解 Leetcode 题解等解决方案。

    57440
    领券