产品介绍

Product introduction

DataExa-Discovery 平台面向文本、图像、视频等多模态数据标注和数据挖掘场景,提供多类型数据源接入、数据集可视化定义、半自动化智能标注、交互式多维数据分析挖掘工具,帮助用户把繁重的数据标注工作变得智能高效,把复杂的数据分析过程变得灵活便捷,助力用户洞悉数据背后隐藏的商业价值,辅助企业决策。

核心技术

Product technology

  • 自学习标注

  • 智能审核

  • 交互式可视化数据探索

  • 自动数据质量分析

产品优势

Product advantage

  • 数据预标注

    具备默认预标注与自定义预标注能力,用户可选择直接采用系统预标注结果,也可自定义上传词库、词向量、知识库、模型等进行自定义预标注,提升预标注质量
  • 自动标注学习

    提供自学习算法,能够基于人工预先标注的少量数据进行数据自动标注学习,使机器具备自动标注剩余数据的能力,数据标注完成可直接进入审核过程,大幅提高标注效率
  • 大规模协作

    支持单机独立标注与分布式大规模协同标注两种标注方式,适合需多人协同的大规模、高质量数据标注场景
  • 严控质量

    对标注结果提供人工审核、交叉审核、智能审核等多种审核方式,对完成标注的结果数据提供可视化面板配置数据质量评估策略,严格把控数据标注质量
  • 可视化数据探索

    支持通过柱状图、饼状图、箱型图、相关系数、帕累托图、茎叶图等多种可视化图表开展直观、灵活的数据分析探索,帮助用户发掘数据背后的隐藏信息
  • 自动化数据质量分析

    自动识别缺失数据、异常值、编码不一致、度量标准异常、矛盾数据等各类错误数据,提醒用户并提供解决方案,能够自动进行缺失值和异常值处理,提高数据质量

客户案例

Customer case

AI平台之标注业务
  • 客户名称:

    某四大行之一

  • 所属行业:

    金融

  • 客户痛点:

    现有标注工具可标注类型较少,操作不友好,标注耗费较多人力资源;企业内外部数据标注格式不统一,标注成果无法通用。

  • 应用成效:

    平台提供的预标注、自学习标注、智能审核等功能,以及便捷的操作界面,大幅提高了标注人员工作效率;平台支持标注格式的灵活调整,项目通过平台统一了内外部标注成果格式,实现了外包标注数据和内部AI平台标注数据的复用。

证券行业人工智能平台之数据探索

合作

文档