前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人工智能数据集可视化统计分析工具:快速了解你的数据集

人工智能数据集可视化统计分析工具:快速了解你的数据集

作者头像
深度学习思考者
发布2023-12-12 12:05:12
4000
发布2023-12-12 12:05:12
举报
文章被收录于专栏:深度学习思考者
人工智能数据集可视化统计分析工具:快速了解你的数据集
    • 简介
    • 特征
    • 示例报告
    • 安装
    • 用法

简介

Lightly Insights:可以轻松获取关于机器学习数据集基本洞察的工具,可以可视化图像数据集的基本统计信息,仅需提供一个包含图像和对象检测标签的文件夹,它会生成一个包含指标和图表的静态 HTML 网页。

[1] 详细内容请参阅 MarkAI Blog [2] 更多资料请参阅 MarkAI Github

特征

  • 支持所有可以使用Labelformat包读取的对象检测标签格式。其中包括 YOLO、COCO、KITTI、PascalVOC、Lightly 和 Labelbox。
  • 显示图像、对象和类别计数
  • 分析有多少图像没有标签,并提供它们的文件名。
  • 显示图像样本
  • 显示图像和物体尺寸的分析
  • 显示每个类的分析,包括对象大小、每个图像的计数、位置热图等。

示例报告

安装

代码语言:javascript
复制
pip install lightly-insights

用法

Lightly Insights 报告由 python 脚本生成。下面的示例使用PascalVOC 2007数据集。您可以按照示例下载它(~450MB):

代码语言:javascript
复制
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
tar -xvf VOCtrainval_06-Nov-2007.tar

要运行 Lightly Insights,我们需要提供:

  • 图片文件夹。在我们的例子中就是./VOCdevkit/VOC2007/JPEGImages。
  • 物体检测标签。对于 PascalVOC,构造函数需要带有注释 ./VOCdevkit/VOC2007/Annotations和类列表的文件夹。
代码语言:javascript
复制
from pathlib import Path
from labelformat.formats import PascalVOCObjectDetectionInput
from lightly_insights import analyze, present

# Analyze an image folder.
image_analysis = analyze.analyze_images(
    image_folder=Path("./VOCdevkit/VOC2007/JPEGImages")
)

# Analyze object detections.
label_input = PascalVOCObjectDetectionInput(
    input_folder=Path("./VOCdevkit/VOC2007/Annotations"),
    category_names=(
        "person,bird,cat,cow,dog,horse,sheep,aeroplane,bicycle,boat,bus,car,"
        + "motorbike,train,bottle,chair,diningtable,pottedplant,sofa,tvmonitor"
    )
)
od_analysis = analyze.analyze_object_detections(label_input=label_input)

# Create HTML report.
present.create_html_report(
    output_folder=Path("./html_report"),
    image_analysis=image_analysis,
    od_analysis=od_analysis,
)

要查看报告,请打开./html_report/index.html.

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-12-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 人工智能数据集可视化统计分析工具:快速了解你的数据集
  • 简介
  • 特征
  • 示例报告
  • 安装
  • 用法
相关产品与服务
人工智能与机器学习
提供全球领先的人脸识别、文字识别、图像识别、语音技术、NLP、人工智能服务平台等多项人工智能技术,共享 AI 领域应用场景和解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档