机器之心报道
机器之心编辑部
很快就将扩展到所有论文。
今年 10 月,著名预印版论文平台 arXiv 宣布获得 1000 万元捐款,现在版本大升级来了。
本周四,arXiv 宣布了一项更新,正式加入论文 HTML 版本。
消息一出,立刻引来了学界的欢呼,有人发现 arXiv 也已经准备好了暗黑模式:
arXiv 是计算机科学、物理学、数学、生物学等学术领域常用论文预印本网站,创立于 1991 年。一直以来,arXiv 上论文的显示方式都以 pdf 格式为主,用户通常需要「下载 PDF(Download PDF)」来查看论文内容。
现在,arXiv 宣布为以 TeX/LaTeX 提交的所有论文生成 HTML 格式版本(要求论文是在 2023 年 12 月 1 日或之后提交的)。
我们以 12 月 17 日提交的一篇论文《A mathematical perspective on Transformers》为例,arXiv 页面右侧 Access Paper 中出现了「HTML (experimental)」选项,点击就可以查看该论文的 HTML 格式版本。
HTML 不会取代 PDF,而是成为 arXiv 用户可用的附加格式。论文提交者将被邀请在提交期间预览其论文的 HTML 版本,就像 PDF 版本一样。
相比于 PDF 格式,HTML 格式最大的优势就是「便捷」,用户无需下载,在网页端就可以直接查看论文内容,浏览器的功能可以直接应用,例如,翻译网页内容:
arXiv 表示:「以 HTML 格式提供 arXiv 论文的请求直接来自残障科学家,他们在获取所需研究方面面临障碍。HTML 格式的论文可以通过屏幕阅读器和其他技术更轻松、更准确地阅读,这可以帮助有阅读障碍(包括失明、视力低下等)的研究人员。」
这也是 arXiv 在今年 10 月获得 1000 万美元捐款之后的一次重大更新。
网友纷纷表示:「HTML 格式版本使论文更容易编辑、更容易在线阅读浏览。但是 PDF 方便打印,HTML 功能是下载 PDF 的补充,而不是替代。」
目前,arXiv 提供 HTML 格式版本论文的功能仍处于实验测试阶段,并非所有论文都能正确转换为 HTML。研发团队正在努力使转换更加准确。
参考链接:
https://blog.arxiv.org/2023/12/21/accessibility-update-arxiv-now-offers-papers-in-html-format/
https://news.ycombinator.com/item?id=38724665
领取专属 10元无门槛券
私享最新 技术干货