言归正传,今天介绍一个非常方便的「基于Zotero的毕业论文参考文献工作流」,包括「引用格式修改」、「三步(10s内)下载保存文献」和「中英文混排」过程中需要注意的点。
无论是大学期间的小论文还是令人头秃的毕业论文, 查找文献是必不可少的环节. 而这个过程说到底就两句话:
使用EndNote,你可以将各种文献信息导入到软件中,例如期刊文章、专利、书籍等等。EndNote支持多种文献格式,包括APA、MLA、Harvard等等,让你能够满足不同领域和期刊的参考文献要求。
在Latex中,一般使用.bib文件,维护一个参考文献库,对于中英文要求文后的参考文献显示格式不同,我们仅需要修改.tex文件中的引用格式即可。
今天要给大家解决的是使用Endnote过程中,参考文献出现的中英文混排问题,如下图所示,在使用国标参考文献格式的时候,英文作者省略用et al.是没问题的,但是中文作者在使用Endnote的时候,出现et al.就不合适了,应该换成等才对。
写毕业论文的时候,是不是觉得管理参考文献比较折磨人?即使用了文献管理软件,但是在引用文献的时候还是会有格式的问题。尤其是今年弄了个论文检测系统,参考文献太好报错了。为了解决参考文献引用格式的麻烦,修改出中南财大硕博论文的 Zotero 参考文献样式。经过测试,排版出来的文献能够通过机器的检测。
本文介绍基于EndNote等软件在Word中插入参考文献后,将中文参考文献中的et al.替换为等的方法。
本文介绍如何利用EndNote,对论文参考文献中英文文献的汉语拼音姓名(即作者包含中国人的英文文章)的名的第二个字的首写字母加以补充显示。例如,假如有如下一篇文章:
又是一年毕业季,只有真正到自己毕业的时候才发现,改论文格式真是一件费心费力的事情。为了节省时间,方便后续对论文的修改和调整,我很早就开始研究基于Zotero的引用方法,这段时间也反复修改基于2015年国标的格式(JM Chinese Std GB/T 7714-2015),最终算是二次加工出来一个符合我们学校毕业论文要求的格式,现在无偿分享给大家使用「也欢迎大家给我加鸡腿!」。
于是我依次点击 编辑 输出样式 编辑“当前的样式” 作者列表
写毕业论文按照GB/T 7714-2015中英文混排各种不顺后,花了一周的时间研究了下 Zotero,包括基本用法、插件使用和进阶用途,用以打造文献管理生态。防止遗忘,整理了下关键问题和学习路径,如果以后有时间再展开写详细教程。在学习过程中参考了Zotero 官网[1]、青柠学术[2]和韩义敏老师知乎教程[3],以及其他相关教程,表示感谢。
7 月 19 日,Meta 终于发布了免费可商用版本 Llama 2,让开源大模型领域的格局发生了巨大变化。
目录 空格 中英文之间需要增加空格 中文与数字之间需要增加空格 数字与单位之间需要增加空格 全角标点与其他字符之间不加空格 -ms-text-autospace to the rescue
「有研究显示,打字的时候不喜欢在中文和英文之间加空格的人,感情路都走得很辛苦,有七成的比例会在 34 岁的时候跟自己不爱的人结婚,而其余三成的人最后只能把遗产留给自己的猫。毕竟爱情跟书写都需要适时地留白。
最近在检索文献时,忽然发现了和检索文献高度相关的专利,又想到以前听老师说有人申请了什么什么专利,想了解详细信息却苦苦无门;或者看文献时,提到所用药物已申请中国专利,不知道怎么搜索全文;或者知道国外专利号,却不知道如何下载。现在,我将分享自己下载专利pdf全文的几个常用网站,希望有所帮助。
众所周知,TCGA和GEO是最著名的两大公共数据库,前者主要存储高通量(二代测序)数据的肿瘤样本数据(TCGA的0代码可视化已被临床生信之家实现)。
IntelljIDEA 是一个非常不错的Java IDE,IdeaVim插件更是让喜欢用vim的我兴奋不已。但是IdeaVim对中文输入的支持不太好,要频繁切换中英文很麻烦。今年推荐一款插件可能解决这个问题哦。目前只支持Windows和mac。效果如下:
OCR技术有着丰富的应用场景,包括已经在日常生活中广泛应用的面向垂类的结构化文本识别,如车牌识别、银行卡信息识别、身份证信息识别、火车票信息识别等等,此外,通用OCR技术也有广泛的应用,如在视频场景中,经常使用OCR技术进行字幕自动翻译、内容安全监控等等,或者与视觉特征相结合,完成视频理解、视频搜索等任务。
工欲善其事,必先利其器。使用LaTex写作感觉和写代码差不多,都需要一个好的IDE,Coding我喜欢用VS code,sublime。而LaTex写作,因为我又不是win用户,word用起来稍显费劲,所以着实摸索了一阵子。
虽然说我们也有国产的百度学术,但和站在巨人肩膀上的Google Scholar相比,只能说是拙劣的模仿者。
SimpleAI推荐语:剑林大神的博客是我见过的将复杂知识讲解的最通俗易懂又鞭辟入里的博客,而且他的文字功底也十分了得,让人读罢大呼过瘾。这篇文章,从“熵”的角度,剖析了NLP许多基础技术背后的基本原理,十分值得一读。
(很多文章中都推荐各种杂七杂八的网站,但就小编的个人经验,最好是2~3个功能强大的途径就行了,毕竟科研狗平时也没有那么多的脑子用在记各种网址上......)
1966年,人工智能学家Minsky在给学生布置的作业中,要求学生通过编写一个程序让计算机告诉我们它通过摄像头看到了什么,这也被认为是计算机视觉(Computer Vision,CV)最早的任务描述。到了21世纪,计算机视觉进入快速发展阶段,尤其近几年,计算机视觉迅猛发展。
9月15日,北京人工智能产业峰会暨中关村科学城科创大赛颁奖典礼现场,智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP(massive text pairs)。
这是一篇我在 2011年03月 写的文章,目前还能搜到一些记录。许久不开谷歌邮箱,今天打开忽然看到今年01月份的一个网友在博客园的留言:
我的实现方式是在项目安装的时候,选择 语言,然后项目中根据选择的语言进行输出对应的中英文,如下图。
日前,智源研究院大模型研究团队开源最新双语 AltDiffusion 模型,为中文世界带来专业级 AI 文图创作的强劲动力:
【新智元导读】在利用深度网络解决问题的时候人们常常倾向于设计更为复杂的网络收集更多的数据以期获得更高的性能。但是,随之而来的是模型的复杂度急剧提升,参数越来越多,给深度学习在设备上的应用带来挑战。阿里iDST团队最新提出的ADMM神经网络压缩和加速算法,可以无损地压缩掉最后一个比特。论文已经被AAAI 2018录用为oral。 近年来,深度学习在人工智能领域取得了重大的突破。在计算机视觉、语音识别等诸多领域,深度神经网络(DNN, Deep Neural Network)均被证明是一种极具成效的问题解决方式
正常情况下,汉字,Emoji 字符,数字与英文字母都是单独的字符。这里对 2 个数字/英文相当于 1 个字,所以在计算字符串长度时,不能够使用 []rune 强转后来获取其长度,而是需要统计出数字与英文字母的数量,再加上其他字符数量,作为其长度。所以,要想实现产品同学的要求,关键是需要统计出用户输入文本中的数字与英文字母的数量。
《自然语言处理实战入门》 ---- 第4课 :中文分词原理及相关组件简介 之 语言学与分词技术简介
LOGO语言是一种早期的编程语言,也是一种与自然语言非常接近的编程语言,它通过“绘图”的方式来学习编程,对初学者特别是儿童进行寓教于乐的教学方式。LOGO语言创始于1968年,是美国国家科学基金会所资助的一项专案研究,在麻省理工学院人工智能研究室完成。
地址 https://github.com/zibuyu/research_tao
本期推送第四篇:如何通过文献掌握学术动态,感兴趣的同学可以直接在Github上阅读。
导语:中文世界的AIGC已然开启。通过智源研究院大模型研究团队开源的双语 AltDiffusion 模型,可以实现精细长中文Prompts高级创作。
伴随着大模型开发和应用的火热发展,作为大模型核心基础组件的 Embedding 重要性愈发凸显。智源于一月前发布的开源可商用中英文语义向量模型 BGE(BAAI General Embedding)在社区收获颇高关注度,Hugging Face 累计下载量达到数十万。当前,BGE 快速迭代推出 1.5 版本并公布多项更新,其中,BGE 首次开源 3 亿条大规模训练数据,帮助社区训练同类模型,推动该领域技术发展。
一个 Builder 类会一步一步构造最终的对象。该 Builder 类是独立于其他对象的。
想写这篇文章很久了,也想做这件事很久了,我个人感觉自己是有强迫症的,所以一直有什么事让我看着不太舒服就想把它纠正过来。
内功和外功,作为诸多武侠小说的两大流派,有着诸多区别。内功主要是内力,外功主要是拳脚功夫,如熟知的降龙十八掌就是外家的顶峰功夫,任何武功若想发挥最大的威力都离不开内功的精深。内功是道,外功是术,道术结合,东方不败。作为一个业余的武侠小说爱好者和刚入门的科研爱好者,这次从内功和外功的两个角度出发,介绍我们我们组在 EMNLP 2023 中的两个工作,如有不当之处,敬请原谅:
word-wrap: normal Default. Content exceeds the boundaries of its container. break-word Content wraps to next line, and a word-break occurs when necessary. 必要时会触发word-break。
「有研究顯示,打字的時候不喜歡在中文和英文之間加空格的人,感情路都走得很辛苦,有七成的比例會在 34 歲的時候跟自己不愛的人結婚,而其餘三成的人最後只能把遺產留給自己的貓。畢竟愛情跟書寫都需要適時地留白。
本文介绍了ChatGLM2-6B和ChatGLM-6B这两个开源的中英双语对话模型,它们由清华大学的KEG和数据挖掘小组(THUDM)开发和发布。这两个模型是基于GLM模型的混合目标函数,在1.4万亿中英文tokens数据集上进行训练,并实现了模型对齐。本文将探讨它们的优势、应用场景、训练数据集来源以及如何使用它们进行对话生成和微调。
我们做网站内容,主要还是以文字图片混排来实现的,那么中英文混排的时候,有一个小细节不知道大家注意到没有,就是 WordPress 文章中英文数字间添加空格。一篇排版美观合理的文章,能给访客带来很好的阅读体验,同时可以提高二次回访率;同时搜索引擎在收录、索引文章时,对于文章排版的要求也是存在的,所以做好网站文章的排版是重要的“小细节”。所以今天用纯代码实现WordPress 文章中英文数字间自动添加空格。 对于这种中英文数字间添加空格的调整,不但有助于提升用户体验度,还对于 SEO 有一定好处,搜索引擎蜘蛛也
VSCode 中的 alt+shift 快捷键能够同时操作多列,但其前提是被操作的部分要完全对齐,这就要求 VSCode 编缉器使用的字体得是等宽的。
本文为《程序员》电子刊原创文章,如需转载请注名出处 作者:唐杰、张静、张宇韬 摘要:AMiner利用数据挖掘和社会网络分析与挖掘技术,提供研究者语义信息抽取、面向话题的专家搜索、权威机构搜索、话题发现和趋势分析、基于话题的社会影响力分析、研究者社会网络关系识别等众多功能。 学术文献记载着科学的发展和进步,在科技日新月异高速发展并成为“第一生产力”的今天,学术信息,包括:论文,作者和会议,以及这些实体之间的相互关系,对研究界和企业界都起着越来越重要的作用。有效进行科技论文的组织与管理不仅可以有效提高论文质量
如果开发一个软件,需要用到PDF功能,您的选择是基于Adobe PDF吗? 如果是基于Adobe PDF,需要用户安装一个几十M的Adobe的安装包,这显然是不友好的。
什么是函数? 在编程中,函数和通常数学中的函数概念并不完全相同;编程中的函数更接近于一个写好的工具,在开发某些功能时,所需要到该函数,就把该函数拿过来使用。
对于Python这种自带电池的语言来说,避免项目开发、部署的导致的系统混乱,为每个项目定制一个自己的环境十分重要。这三个工具都有详细的文档,建议大家有时间就阅读文档学习吧。本文只是根据自己的使用对其中常用的做简要说明。
进行nlp任务都需要进行Tokenize,Tokenize可以理解为是把长句子拆分成有”意义"的小部件,这里的有"意义"是指最终能够使得计算机理解。
前面介绍了,XPath, id , class , link text, partial link text, tag name, name 七大元素定位方法,本文介绍webdriver支持的最后一个方法:by_css。css和XPath类似,也需要掌握一些语法,才能写出正确的,完整的css选择表达式。相关w3c介绍,请点击这里。
领取专属 10元无门槛券
手把手带您无忧上云