“AI 开发者”即日起全新升级为“AI 源创评论”,在延续开发者、开源、赛事报道的基础上,增加技术人物栏目“AI 源创 100”、企业开源&技术实力数据库“AI 源创因子”、开发者线下峰会“AI 源创会”,为开发者、企业带来更全面、深入的信息、技术服务。
近日,史密森尼学会宣布,将 280 万张其收藏的高分辨率二维和三维图像发布到一个开放的在线平台上,用户可以免费阅读和下载这些资源。
史密森尼学会是美国一系列博物馆和研究机构的集合组织,拥有世界最大的博物馆系统和研究联合体。成立于 1846 年,其宗旨是「知识的增长和传播」。
成立 174 年以来,这是史密森尼学会首次做这样的尝试。这个数据库包括史密森博物馆、9 个研究中心、图书馆、档案馆和国家动物园等 19 个博物馆的数据和资料,旨在鼓励公众发挥自己的想象力,重复使用并将其转换为他们选择的任何东西,无论是明信片,啤酒 koozie 还是短靴、短裤。
开放获取,自由创作
该数据库的发布也标志着全球不断努力将博物馆藏品迁移到公共领域的最新胜利。
近年来,包括阿姆斯特丹国家博物馆、纽约大都会艺术博物馆和芝加哥艺术学院在内的全球近 200 家机构也采取了类似的举措,将它们的杰作数字化并发布出来。但伦敦国王学院数字文化遗产专家 Simon Tanner 表示,史密森尼学会的发行规模在深度和广度上都是「前所未有的」。
该数据库涵盖了艺术、人文、科学和工程等领域,数据集的规模之大令人震惊,它做到了以前很难想象的事情,开辟了跨越科学和文化、空间和时间的更广泛的内容范围。这是对人类知识的惊人贡献。
Effie Kapsalis 是史密森尼学会的高级数字项目官员,正在领导这项工作,她表示,他们的关键使命是成为世界各地人们的学习资源,「我们无法想象人们会如何处理这些收藏品,但我们已经做好了接受惊喜的准备。」
直到最近,史密森尼学会仍然保留对其艺术作品的高质量数字版本的权利。根据 CreativeCommonsZero(CC0),新数据库中指定为 CC0 的部分不受版权限制,人们可以根据自己的想法和灵感,自由地利用这些图像,包括用于商业目的。
目前,已经有人用这些数据做出了自己的作品。
艺术家 Amy Karle 制作了一系列雕塑,这些雕塑描绘了国家自然历史博物馆中有着 6600 万年历史的三角龙 Hatcher。Karle 擅长强调身体形态和功能的三维艺术作品,她热衷于利用现代科技让化石复活。她的九个三维印刷雕塑中有六个是 Hatcher 脊椎的复杂模型,每一个都在生物工程的精神下稍微「重新混合」。
三角龙化石形态重建
Amy Karle 创作的三角龙「Hatcher」系列雕塑
此外,插画家 duo Jon Scieszka 和 Steven Weinberg 发布了一本教孩子们将史密森尼学会的收藏品转变成滑稽的新艺术形式的小册子。这与他们 2019 年的儿童读物《AstroNuts》相呼应,该书采用了一组从 2013 年荷兰国家博物馆发布的图片拼凑成了一系列五颜六色的滑稽角色。
duo Jon Scieszka 和 Steven Weinberg 发布的小册子
在这本小册子中,史密森尼学会的创始人 James Smithson 在 AstroNuts 随行人员的陪同下,引导读者完成了示例 Collagasaurus 的构造工作,该作品由博物馆中公共领域的中流砥柱组成,包括 George Washington 的手臂,剑龙的尾巴和 Charlie Parker 的萨克斯管(图中大象的鼻子)。
「Steven 和我就是为此而生,」Scieszka 说,「我喜欢做的事情是拿到一件东西,然后把它弄得一团糟。」他补充道,他们的目的是鼓励孩子们也这样做,这一过程中有所收获。
Weinberg 说,当孩子们自己动手的时候,那就是深入研究某个主题的开始,他们将拥有非常丰富的艺术品知识。
Sallie E.Garrity 的 Ida B.Wells
在开放获取时代,大量的研究工作也可能蓬勃发展。在与 Google 的一次合作中,史密森学会在其数据集中部署了机器学习算法,充实了其塑造科学史的著名女性名单。
Tanner 说,如果人们所依赖的知识是公开的,那么你就可以更频繁、更早地获得创新。
2020 年还将发布 20 万张图片
如何获取这些数字资源?
该数据库的官方网址为:https://www.si.edu/openaccess
此外,还可以通过以下途径获取这些数据:
史密森尼学会和研究中心的个人网站
史密森学习实验室:http://learninglab.si.edu/openaccess
GitHub repo:https://github.com/Smithsonian/OpenAccess
史密森公共 API:https://edan.si.edu/openaccess/apidocs/
史密森研究数据共享:https://smithsonian.figshare.com/?searchMode=1&licenses=2
第三方平台,如 Creative Commons、Digital Public Library of America、Internet Archive、Wikimedia Commons、GBIF,以及通过国家自然历史博物馆 Internet publishing toolkit(IPT)实用程序以 DarwinCore 格式批量下载自然历史收藏数据。
2019 年,史密森尼的网站访客达到了 1.54 亿人次,网站总满意度为 80%,YouTube 视频点击量为 3.076 亿。2019 年年底,史密森尼的 Facebook、Twitter、Instagram 粉丝总数达到了 1,660 万。这些数据表明,史密森尼的数字资源能力毋庸置疑。
自 2020 年 2 月 20 日数字资源开放以来,资源访问量累计 4,417,104 次,下载 32,649 次。
2 月 20 日以来的访问量和下载量
然而,这只是一个开始。史密森学会在首次发行中发布的藏品不到总藏品的 2%。在 2020 年余下的时间里,史密森博物馆将再发布 20 万张左右的图片,随着该机构继续将 1.55 亿件收藏品数字化并进行统计,还会发布更多的图片。
虽然其余资源也会陆续开放,但 Kapsalis 强调,在可预见的未来,有些重要的内容不可能会公开,包括濒危物种的位置信息、剥削性图像和边缘化社区的文物。她解释说,如果这些数据和材料被公布,可能会危及弱势群体的生计、价值观甚至生存。
Kapsalis 说,过去人们捕捉某些文化的方式并不总是尊重他人的。她认为,在道德上,我们不能把这些项目放在开放的途径分享。在开放之前必须咨询受影响的社区,他们的意见才是最重要的。
最重要的是,开放访问计划在史密森尼学会及其全球受众之间建立了一种重新定义的关系。这意味着信任必须是双向的。但同时,这次发布也是该机构使命的体现,即「知识的增长和传播」。人们将不仅仅是史密森尼学会的参观者,还将是其遗产的参与者和创造者。
via:https://www.smithsonianmag.com/smithsonian-institution/smithsonian-releases-28-million-images-public-domain-180974263/
https://www.si.edu/openaccess
领取专属 10元无门槛券
私享最新 技术干货