首页
学习
活动
专区
工具
TVP
发布

磐创AI技术团队的专栏

定期分享机器学习深度学习相关优质原创文章
专栏成员
726
文章
1016207
阅读量
125
订阅数
ChatGPT 高级数据分析用于自定义 Matplotlib 测井图
ChatGPT 的代码解释器,现在更名为高级数据分析,已经发布一段时间了。它于2023年7月6日推出,是由OpenAI开发的插件,允许用户上传数据并对其进行分析。这可以包括清理数据、创建可视化图表和总结数据。
磐创AI
2024-07-01
890
变点检测 —— 一种贝叶斯方法
变点分析已经成为研究的许多领域的关注点。这种分析指的是在给定时间序列中找到突变或突然变化的问题。根据岩田等人(2018)的定义,变点分析是“识别时间序列发生概率分布变化的时刻的方法。”根据范登伯格和威廉斯(2020)的说法,“时间序列行为中突变的时刻通常是引起警报的原因,因为它们可能暗示数据生成过程发生了显著变化。”
磐创AI
2024-07-01
900
CFXplorer: 生成反事实解释的Python包
随着机器学习模型在现实场景中的应用越来越广泛,解释模型的可解释性变得越来越重要。了解模型如何做出决策不仅有益于模型的用户,还有助于受模型决策影响的人们理解。为了解决这个问题,人们开发了反事实解释,因为它们允许个体了解通过扰动原始数据如何实现期望的结果。在短期内,反事实解释可能向受机器学习模型决策影响的人提供可行的建议。例如,一个被拒绝贷款申请的人可以了解这次可以采取什么措施来获得接受,并且这对改进下一次申请是有用的。
磐创AI
2024-06-07
420
拥有LLM模型
大型语言模型(LLM)越来越显示出其价值。将图像纳入LLMs使它们作为视觉语言模型更加有用。在本文中,我将解释一个名为GIT-LLM的模型的开发,这是一个简单但强大的视觉语言模型。一些部分,比如代码解释,可能会感觉有点繁琐,所以可以直接跳到结果部分。我进行了各种实验和分析,因此我认为你会喜欢看到我能够取得的成就。
磐创AI
2024-06-06
840
arXiv关键词提取
KeyBERT Taipy Kenneth Leung 数据科学 机器学习 由Marylou Fortier拍摄的照片(Unsplash) 随着来自社交媒体、客户评论和在线平台等来源的文本数据数量呈指数级增长,我们必须能够理解这些非结构化数据。
磐创AI
2024-06-06
1100
使用Python进行图像处理
好吧,这个概念是天空的图片是相对平坦的。另一方面,摩天大楼是颜色、形状、窗户、水泥等的混合体。
磐创AI
2024-05-27
920
OpenAI深夜王炸!重磅推出GPT-4o大模型!能实时语音视频通话关键还免费!
【导读】看了OpenAI凌晨关于GPT4o的发布会实在太震撼了!兄弟们!通用人工智能AGI的时代可能真的要提前到来了!
磐创AI
2024-05-27
1280
网格搜索或随机搜索
机器学习并不总是像Iris、Titanic或Boston House Pricing数据集那样简单。
磐创AI
2024-05-17
660
主题建模 — 简介与实现
在自然语言处理(NLP)的背景下,主题建模是一种无监督(即数据没有标签)的机器学习任务,其中算法的任务是基于文档内容为一组文档分配主题。给定的文档通常以不同比例包含多个主题 — 例如,如果文档是关于汽车的,我们预期汽车的名称会比某些其他主题(例如动物的名称)更突出,而我们预期诸如“the”和“are”之类的词汇会几乎等比例出现。主题模型实施数学方法来量化给定文档集合的这些主题的概率。
磐创AI
2024-05-08
1450
扎克伯格发布“史上最强大开源模型”——Llama3,Meta AI 挑战 OpenAI!
近日,Meta 在官网官宣开源模型Llama-3系列, Llama 3 8B(80亿参数)和70B(700亿参数)两个版本!Meta 将 Llama 3 称为有史以来最强的开源大模型!除了这两个版本,扎克伯克透露,Llama 3 最大的4050亿参数的模型仍在训练中。
磐创AI
2024-04-28
2020
地理空间数据的时间序列分析
例如,在环境科学中,时间序列分析有助于分析一个地区的土地覆盖/土地利用随时间的变化及其潜在驱动因素。它在气象研究中也很有用,可以帮助我们理解天气模式的时空变化(我将很快使用降雨数据演示一个这样的案例研究)。社会和经济科学在理解时间和空间现象的动态方面也极大受益,例如人口、经济和政治模式。
磐创AI
2024-04-28
1190
为什么梯度提升表现如此出色?
诸如xgboost之类的梯度提升算法是表格数据中表现最佳的模型之一。与其他模型(如随机森林)一样,梯度提升属于集成模型的范畴。该名称来源于该范畴的一个核心特征:它们不适应单个大模型,而是适应一个由多个模型组成的整体模型集合。集成模型与基础函数的概念密切相关。两者都使用较简单的构建块,这些构建块组合在一起以解决更复杂的问题。
磐创AI
2024-04-22
840
生存分析:优化Cox模型的部分似然
在本文中,我们介绍了一种流行的生存分析算法,Cox比例风险模型¹。然后,我们定义了其对数部分似然和梯度,并通过一个实际的Python示例对其进行优化,以找到最佳的模型参数集。
磐创AI
2024-04-15
1420
超10秒高分辨率,北大Open Sora视频生成更强了,还支持华为芯片!
【导读】OpenAI 在今年年初扔出一项重大研究,Sora 将视频生成带入一个新的高度,很多人表示,现在的 OpenAI 一出手就是王炸。然而,众多周知的是,OpenAI 一向并不 Open,关于 Sora 的更多细节我们无从得知。谁能率先发布类 Sora 研究成了一个热门话题。
磐创AI
2024-04-15
1450
Streamlit颜色选择器
Streamlit的一个有用功能是颜色选择器工具。这使你可以通过让用户选择任何颜色,而不是使用默认的硬编码颜色,为你的仪表板添加灵活性。
磐创AI
2024-04-15
1760
带有依从性预测区间的时间序列预测
在进行时间序列预测任务时,我们通常会开发产生未来观测点的点估计的解决方案。这是正确的,如果经过适当验证,它们可能对业务结果产生积极影响。有没有可能做得更好?通过简单添加更多信息,我们能够提供更详细的预测吗?
磐创AI
2024-04-03
750
霍尔特-温特斯的时间序列预测
我们讨论一组非常知名的预测模型,指数平滑。指数平滑的基本原则是将更多的权重放在最近的观测值上,而在历史观测值上放置更少的权重,以用来预测时间序列。
磐创AI
2024-04-03
3250
Python列表创建的技巧
《Effective Python》是Brett Slatkin撰写的一本涵盖59种写更好Python代码的具体方法的书籍。该书以随机访问的方式编写,每个主题都有独立的源代码。对于中级Python程序员来说,无论是工程师还是数据科学家,这是一个很好的资源,因为它涵盖了可以以任何顺序学习的广泛主题范围。
磐创AI
2024-04-03
750
英伟达发布全球最强芯片B200!AGI的时代真要提前到来?
【导读】2024年3月18日,英伟达在美国硅谷的圣何塞会议中心举行了2024年度AI大会GTC(GPU Technology Conference)。在这场人工智能大会上,英伟达的新一代性能巨兽Backwell B200诞生了!
磐创AI
2024-04-03
1360
加载大型CSV文件到Pandas DataFrame的技巧和诀窍
现实世界中的大多数数据集通常都非常庞大,以千兆字节为单位,并包含数百万行。在本文中,我将讨论处理大型CSV数据集时可以采用的一些技巧。
磐创AI
2024-04-03
1860
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档