Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >档案文件如何才能发挥更大的价值

档案文件如何才能发挥更大的价值

作者头像
明月AI
发布于 2022-11-07 05:04:53
发布于 2022-11-07 05:04:53
4170
举报
文章被收录于专栏:野生AI架构师野生AI架构师

一个企业的档案文件的类型是多种多样的,包括文本,图像,电子档,扫描件,音视频等等,怎么样才能让它们发挥更大的价值呢?

档案价值是什么

说到价值,我们最直接能类比的就是钱,钱的价值就是能用来交换自己所需要的产品或者服务,而要让钱发挥更大的作用,政府就要想办法让钱更快地流动起来,让钱能配置到更高效的地方,或者让钱能到更需要的人的手里。

那档案的价值是什么?百度百科上有一个档案价值的词条,摘录一段:

档案价值是指主体与客体的关系,因而决定了档案这一客观物是档案价值的物质承载者,它只有进入社会和人的活动领域,为人所共识,并同人的实际需要相联系,相统一时,才使档案及其属性进入价值化过程,与人的需要构成价值关系。故档案的价值不是单方面决定的,而是相互作用的产物,即取决于档案的客体属性和主体的需要这两方面的统一,二者缺一不可。据此,所谓档案的价值实为档案的使用价值,就是档案这一客观存在物对人们所具有的实用性或有益性及有用程度。

(以上这段摘自百度百科)

简单说就是,档案及其属性要和人的需求相匹配,才能产生价值。其实,任何一种实体的价值化,应该都是这样的。

怎么才能让档案发挥更大的价值

理解了什么是档案价值,那么怎么样才能发挥更大价值就好理解了。简单说就是:

更高效地把档案及其属性和更多有需要的人链接起来。

相当于就是效率乘以数量,就像店铺的收益等于客单价乘以客户数类似。

提升链接效率

可以从以下几点考虑:

1. 数据资产:就像经营店铺一样,首先得清楚自己有什么,得先有一个商品目录,才知道自己的商品应该卖给谁。对于商品来说,一个店铺通常不太多,但是对于档案来说,分分钟就是几千万几亿,需要的就是资产目录,有了这个才更容易提升效率。

2. 快速检索:怎么能快速地从几亿份文档里快速检索到自己需要的文档,就像大海捞针一样,要是没点技术,那将价值就大打折扣。就像那些查案的影视剧一样,要找历史相似案例的时候,就一堆人没日没夜翻卷宗,或者没日没夜的盯着历史监控视频看。

而要实现快速检索,有两个技术就非常关键:

2.1 多模态文档数据的半结构化与结构化:半结构化主要就是将各种文档转成文本数据,主要涉及ocr及语音识别等技术,而结构化技术主要就是信息抽取,人脸识别,行为识别,目标检测等技术。

2.2 高效的全文检索技术:对于结构化信息,检索手段非常丰富,不用多说。而对于半结构化数据,虽说也有比较成熟的方案,但是挑战还是有一些的。

3. 快速地建立连接:通常资产目录或者检索系统找到目标档案之后,怎么样和需求方建立连接,就很关键。这也有两个方向:

3.1 信息抽取:目标档案可能非常多,但是需求方可能就只是需要这种文档中的某个信息,能否快速地把这些需要的信息提取出来就很关键。这有两个要点,一是能灵活方便地提取各类的信息,很可能是没法形成固定范式的,第二就是要快,提取个信息,你说要一两个月,那黄花菜都凉了。而这个快的关键就是识别功能前置,就是说在抽取前,系统已经把可以识别的东西都已经识别好了,那这个关键信息抽取,可能就是秒级能完成的,有统一的中台基座很重要。

3.2 分享:有些需求方需要的可能就是文档式的文件,并不需要抽取,那这个问题就转变成怎么能快速地分享给档案的需求方。而阻碍这个分享过程的关键因素就是数据安全

是否可以只分享文档中需要分享的内容?

分享出去的文档会不会被第三方截获?

分享出去的文档有没有隐私信息?如果有,会不会被泄露?

如果文档被泄露到了网络上,是否可以追踪到是谁泄露出去的?

如果这几个问题能够被很好的解决,那么档案的流动就可以加快,也就能产生更多的价值。

提升链接数量

前面提到的技术其实也是有助于提升数量的,只是我觉得侧重点是效率,所以放到了前面。如果本身链接已经很高效了,那剩下的关键就是要让更多有需求的人知道档案的价值点。

能想到的除了主动地加强潜在用户群的培训与交流,技术上能不能为此做些什么呢?

在其他领域,例如电商等,实现途径往往就是推荐引擎,这跟检索对应,一个是主动的,一个是被动的。

关于档案数据推荐引擎,能想到的就是一个档案的关联档案推荐,这应该是有价值的,因为一个事件脉络往往涉及到多个档案,也是一个不那么容易解决的问题。感觉通过文档的相似性性推荐是可以达到这个目的的,但是普通的计算距离的方式,需要构造一种合理的距离公式,或者可以考虑标注数据训练一个判别模型,计算两个文档是否相关。这应该是很有难度的课题,而且效果不好评估,模型也比较难达到通用。

-------------------------------

ps:居然躺着用手机打出了这么多字……又是秃头的夜晚

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-08-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 野生AI架构师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
搞懂Go泛型,看这一篇就够了
在Go语言1.17版本及后续的升级迭代中,泛型新特性无疑是非常重大的一次更新,这个特性的引入无疑为开发者们带来了更多的灵活性和代码复用性。虽然大部分功能不使用泛型也能正常实现,但是泛型带来的灵活性和效率值得我们进行学习和掌握,这篇文章就和大家一下讨论下Go语言的泛型。
闫同学
2025/01/22
5170
搞懂Go泛型,看这一篇就够了
Go 1.24 相比 Go 1.23 有哪些值得注意的改动?
Go 1.24 现在完全支持泛型类型别名(generic type aliases)。这意味着类型别名可以像定义的类型(defined types)一样,拥有自己的类型参数列表。在此之前,类型别名无法直接参数化。
Piper破壳
2025/05/06
3510
理解Golang的泛型
为降低interface{}带来的糟糕阅读体验,新增了any关键字,它实际上是一种语法糖,定义如下:
chandlerpan
2022/07/12
1.5K0
golang泛型基本用法
作者:matrix 被围观: 14 次 发布时间:2025-05-31 分类:Golang | 无评论 »
HHTjim 部落格
2025/06/01
1090
深入浅出Go泛型之泛型使用三步曲
大家好,我是渔夫子,又跟大家见面了。今天跟大家聊聊Go1.18中新增的泛型功能。。
Go学堂
2023/01/31
7840
终于!12年后Golang支持泛型了!(内含10个实例)
导语 | 泛型是一些语言的标配,可以极大地便利开发者,但Golang在之前并不支持泛型。在今年的Go1.17中已经发布了泛型的体验版,这一功能也是为1.18版本泛型正式实装做铺垫。本文将介绍一下泛型在Golang的使用样例及其泛型的发展历史,需要体验的同学可以使用:https://go2goplay.golang.org/或者自行在docker中安装版本。 一、泛型 (一)什么是泛型 谈泛型的概念,可以从多态看起,多态是同一形式表现出不同行为的一种特性,在编程语言中被分为两类,临时性多态和参数化多态。
腾讯云开发者
2021/11/09
2.9K0
Go 1.18泛型的局限性初探
Go 1.18 版本之后正式引入泛型,它被称作类型参数(type parameters),本文初步介绍 Go 中泛型的使用。长期以来 go 都没有泛型的概念,只有接口 interface 偶尔类似的充当泛型的作用,然而接口终究无法满足一些基本的泛型需求,比如这篇文章里,我们会尝试用 Go 的泛型循序渐进地实现一些常见的函数式特性,从而探索 Go 泛型的优势和不足。
yoyofx
2022/05/11
7310
Go 1.18 新增三大功能之一“泛型”怎么使用?
在 Go v1.18 中,Go 语言新增三个功能,分别是“泛型”、“模糊测试” 和 “工作区”。
frank.
2022/12/27
7700
Go 1.21 新内置函数:min、max 和 clear | 技术创作特训营第一期
Go 1.21.0 版本已经正式发布,它带来了许多新特性和改进。其中引入了的三个新内置函数:max、min 和 clear,接下来的内容将详细介绍这些函数的用途和特点。
陈明勇
2023/08/13
1.9K0
Go 1.21 新内置函数:min、max 和 clear | 技术创作特训营第一期
Go 中的泛型:激动人心的突破
在我们选择的编程语言中,我们多长时间会经历一次根本性的变化?有些语言会变化得更频繁一些,但还有些语言会比温布尔登更保守。
深度学习与Python
2022/04/19
5120
Go 泛型
泛型是程序设计语言的一种风格或范式。泛型允许程序员在强类型程序设计语言中编写代码时使用一些以后才指定的类型,在实例化时作为参数指明这些类型。
孤烟
2023/01/06
5550
Go 泛型发展史与基本介绍
根据 Go 官方用户调查结果,在“你最想要的 Go 语言特性”这项调查中,泛型霸榜多年。你可以看下这张摘自2020 年 Go 官方用户调查结果的图片:
贾维斯Echo
2023/12/24
2810
Go 泛型发展史与基本介绍
三分钟学 Go 语言——函数深度解析(下) 可变参数
小熊这两天因为个人种种令人难受的原因,没有能更新,也没有提前请假,给大家道歉歉了。
机智的程序员小熊
2020/05/12
6950
深入理解Golang的泛型
2022年3月15日,争议非常大但同时也备受期待的泛型终于伴随着Go1.18发布了。
KunkkaWu
2023/07/12
1.5K0
深入理解Golang的泛型
Go 泛型
但这个函数只能接收[]int类型的参数,如果我们想支持[]float64类型的参数,我们就需要再定义一个reverseFloat64Slice函数。
f1sh
2024/07/31
970
Java & Go泛型对比
在当今软件开发领域中,泛型是一种强大的编程特性,它能够在不牺牲类型安全的前提下,实现代码的复用和灵活性。Java作为一种老牌的面向对象编程语言,在其长期的发展过程中,已经积累了丰富的泛型经验和应用场景。而Go语言作为一种相对较新的编程语言,也在不断探索和发展其泛型特性,以满足现代软件开发的需求。本文将对Java和Go语言的泛型进行比较和介绍,探讨它们的实现方式、语法特点以及适用场景,帮助读者更好地理解和应用泛型编程。
FunTester
2024/03/22
2080
Java & Go泛型对比
因势而变,因时而动,Go lang1.18入门精炼教程,由白丁入鸿儒,Go lang泛型(generic)的使用EP15
    事实上,泛型才是Go lang1.18最具特色的所在,但为什么我们一定要拖到后面才去探讨泛型?类比的话,我们可以想象一下给小学一年级的学生讲王勃的千古名篇《滕王阁序》,小学生有多大的概率可以理解作者的青云之志以及壮志难酬的愤懑心情?恐怕很难罢,是的,如果对Go lang的强类型语法没有一段时间的体验期,就很难理解泛型这种“反”静态语言概念。
用户9127725
2022/09/23
3120
因势而变,因时而动,Go lang1.18入门精炼教程,由白丁入鸿儒,Go lang泛型(generic)的使用EP15
搞懂Go泛型,看这一篇就够了
在Go语言1.17版本及后续的升级迭代中,泛型新特性无疑是非常重大的一次更新,这个特性的引入无疑为开发者们带来了更多的灵活性和代码复用性。虽然大部分功能不使用泛型也能正常实现,但是泛型带来的灵活性和效率值得我们进行学习和掌握,这篇文章就和大家一下讨论下Go语言的泛型。
闫同学
2025/01/20
3420
Golang 基础之基础语法梳理 (三)
接口 (interface) 定义了一个对象的行为规范, 只定义规范不实现,由具体的对象来实现规范的细节。
帽儿山的枪手
2022/03/20
5720
Golang 基础之基础语法梳理 (三)
Go 语言泛型使用详解
Go v1.18 开始支持泛型,距离 Go 当前版本 v1.23 已经迭代了 5 个大版本了。读者朋友们在使用 Go 语言开发时,是否已经习惯使用泛型了呢?
frank.
2024/11/19
2550
Go 语言泛型使用详解
相关推荐
搞懂Go泛型,看这一篇就够了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档