首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    观点 | 国内各产业加速发展的“利器”——大数据

    随着物联网的应用及智慧产业的爆发,“大数据”这个词汇再次高频度地出现在人们的视线中,围绕大数据做文章也相应催生出了农业大数据、工业大数据、健康大数据、旅游大数据等一批行业领域的大数据概念。作为各行各业智能化变革的重要组成部分,“如何利用大数据”成为传统企业和新兴互联网厂商争相涌入的新一片蓝海。 1 合理利用大数据助力中国各产业加速发展 智慧产业的应用简单来说,需要依托传感前端的智能感知或者数据采集,经过数据筛选、分析等处理,最终根据业务需求提供服务应用的一个过程。其中,大数据起着“中枢”的作用,犹如人体五

    09

    工业大数据:车间物联网数据管理(干货)

    专家们将工业大数据分为公共资源数据、工程类数据、管理类数据和物联数据。传统的管理系统将人作为数据采集端,用流程来固化组织的行为,用指标来衡量评价流程和组织的效率。 工业企业的物联网,就是要将人和物联系起来,将系统和物联系起来,将物作为数据采集端,由人或系统进行数据分析和决策。数据的分析与优化是物联网的关键技术之一,也是未来物联网发挥价值的关键点。 物联网在工业中有很多种应用方式,如物流仓储、生产制造、产品运维等,我们这里重点讲讲生产制造和产品运维。 物联数据的组织方式 工业企业的生产制造物联网应用一般称为车

    07

    电商供应链数仓平台该如何建设?哪些点需要注意?

    导读:随着蜀海供应链业务的发展,供应链中各个环节角色的工作人员利用数据对业务进行增长分析的需求越来越迫切。在过去大数据分析平台架构1.0的实践中,存在数据生产链路太长,架构太复杂,开发运维成本都很高,之前的团队对这个架构的驾驭能力不足,数据冗余,对业务的适应能力较弱和不能快速的响应业务各种数据需求等诸多问题,基于这种问题,我们通过引入Apache Doris引擎优化生产方案,实现蜀海供应链大数据数仓的升级,在数据开发上跑通了一套完整的流程,使我们数据需求的日常迭代更加迅速和开发效率的提升,同时也解决了我们在1.0架构中存在的诸多问题。

    01

    2017年中国国际大数据挖掘大赛落幕 大数据与产业融合是大势所趋

    2017年中国国际大数据挖掘大赛在贵安落幕,吸引全球19个国家和地区的12646支项目团队、5万余人参赛,覆盖政务、医疗、交通、金融、教育等领域。大赛旨在唤醒沉睡的数据,发掘数据的价值。最终麻省理工大学三位博士研发的“数据融合平台”获“数据开放的价值”板块一等奖,博为101异构数据采集平台获“数据挖掘的魅力”板块一等奖,众智云基站项目获得“数字经济的效能”特别奖,蓝杞数据——冷数据黑技术和阿尔法鹰眼获“数字经济的效能”板块一等奖。此外,大赛还举办智慧交通预测挑战赛等三项系列赛事,并发起寻访高成长性大数据“幼苗”活动。

    08

    面向开源软件的自动化漏洞数据采集与处理技术研究

    漏洞数据分散在数百种资源中,这些数据是零散的、非格式化的,导致收集不便、处理复杂。而人工构造的漏洞数据集样本类型简单、特征单一,难以支撑真实软件漏洞检测的研究。因此,软件安全领域缺乏大规模、真实、有效的漏洞数据集。为解决这一问题,本文提出了一个面向开源软件的漏洞数据自动化采集与处理系统,该系统能够从多源平台自动采集补丁文件,经过冗余处理和一致化处理得到精简的数据集,进一步的生成大量漏洞样本。相比现有研究,本文构建的系统可以采集更多源平台的漏洞数据,且漏洞数据更加丰富,样本质量更高。通过深度学习漏洞检测实验证明,经过本文数据集训练的模型,在真实软件漏洞检测中效果更好。

    04

    基于高斯分布和OneClassSVM的异常点检测

    大多数数据挖掘或数据工作中,异常点都会在数据的预处理过程中被认为是“噪音”而剔除,以避免其对总体数据评估和分析挖掘的影响。但某些情况下,如果数据工作的目标就是围绕异常点,那么这些异常点会成为数据工作的焦点。 数据集中的异常数据通常被成为异常点、离群点或孤立点等,典型特征是这些数据的特征或规则与大多数数据不一致,呈现出“异常”的特点,而检测这些数据的方法被称为异常检测。 “噪音”的出现有多种原因,例如业务操作的影响(典型案例如网站广告费用增加10倍,导致流量激增)、数据采集问题(典型案例如数据缺失、不全、溢出、格式匹配等问题)、数据同步问题(异构数据库同步过程中的丢失、连接错误等导致的数据异常),而对离群点进行挖掘分析之前,需要从中区分出真正的“离群数据”,而非“垃圾数据”。

    02
    领券