《Designing ML Systems》的作者是 Chip Huyen,分享自己如果现在创业会考虑的 6 个方向:
1. 数据合成:人工智能在生成和注释数据方面已经变得非常擅长。现在的挑战是确保生成的数据是安全和合法的,例如不侵犯任何知识产权。
2. 模型评估:随着大型语言模型的出现,模型评估变得更加困难。目前我们都将模型视为黑盒,同时模型的输出是开放式的。现在已经出现的模型竞技场式评估、嵌入式评估、人机交互评估以及小型专业评分模型都是值得关注的方向。
3. 能源供应:目前看来,扩展 AI 的瓶颈不再是计算能力,而是电力供应。所以我们应该关注能源相关的问题,包括新能源开发以及现有的能源交易。
4. 独特数据收集应用:我们应该关注那些能够收集独特数据的应用,尤其是比较早期就可以进入市场,并收集足够数据用来持续改进产品的应用。
5. GPU 原生支持:现有的大部分数据科学分析工具,并不适合在 GPU 上原生运行。所以在 GPU 软件层面上,还有很多工作可以做,这里不仅仅是指 NVIDIA 的 GPU,包括其他类型的原生 GPU。
6. 高质量精选互联网:目前互联网上的机器人已经遍布各个角落,无论是搜索、社交媒体还是约会应用,都被机器数据占据,而且机器人在 SEO 方面有天然优势。所以我们需要一个有界限的互联网,例如:限制搜索结果仅限于我信任的人,或者经过验证为人类的所编写的内容。
总的来说,Chip Huyen 对大模型相关产业有比较全面和深刻的思考,提出的观点都很有见地,对从事相关创业的人士具有很好的启发意义。
对于正在做大模型应用开发的公司或个人开发者而言,上面所讨论的技术、数据、能源、评估和软件工具等方向值得仔细考量。
更需要审视自己当前的项目,评估其与这些方向的一致性,以确保你的项目能和不断发展的趋势保持同步。
领取专属 10元无门槛券
私享最新 技术干货