⏳
DIN: AI Agent Blockchain
中文
中文
  • 关于 DIN
    • ⏳ DIN 概述
    • 🛣️ 我们的历程
  • DIN 操作与介绍
    • 💡 市场与趋势分析
      • 当前数据趋势和市场概述
      • 当前AI趋势和市场概览
      • 市场中存在的差距和机会
    • 🏠 DIN 架构
      • 🔢 数据层:一切为了数据
        • AI 数据流
        • 数据收集
        • 数据验证
        • 数据向量化
        • 奖励机制
      • 服务层:AI 代理工具包
        • LLMOps
        • RAG(检索增强生成)
          • 混合搜索
          • 重排序
          • 检索
        • 注释回复
      • 应用层-生态及产品
        • Analytix
        • xData
        • Reiki
  • DIN如何工作
    • ⛓️DIN区块链
      • 主网
      • 测试网
    • 🏦DIN基金会
      • 团队和顾问钱包
      • 做市&流动性钱包
      • 社区钱包
      • 投资人钱包
      • 生态钱包
    • 💰 代币经济学与应用
      • 代币分配
      • 空投
      • 合约
      • 生态系统内代币的使用案例
  • 如何参与
    • 🧲xData 介绍
    • ⚙️Chipper Node 介绍
      • 如何运行 Chipper 节点
      • xDIN农场
      • 节点委托
        • 撤销委托
        • 成为受托人
      • 节点统计
      • 相关智能合约地址
  • 🤑赚取$DIN
  • 💹质押$DIN
  • 🌉购买$DIN
  • ROADMAP
    • 🎆 2025 Forward
由 GitBook 提供支持
在本页

这有帮助吗?

  1. DIN 操作与介绍
  2. 🏠 DIN 架构
  3. 🔢 数据层:一切为了数据

数据收集

上一页AI 数据流下一页数据验证

最后更新于7个月前

这有帮助吗?

在AI领域,收集数据是阻碍进展的一大障碍。许多机器学习项目的工作都集中在数据准备上,包括数据的收集、清理、分析、可视化展示以及特征准备。在所有这些步骤中,数据收集是最困难的,原因如下:

首先,当机器学习应用于新领域时,通常没有足够的数据来训练模型。像语言翻译或物体识别等较老的领域,多年来已经积累了大量的数据,但新兴领域则没有这种优势。

此外,随着深度学习的普及,数据需求也在增加。在传统的机器学习中,特征提取占用了大量时间,需要深入了解领域以选择和创建用于训练的特征。而深度学习通过自动识别特征简化了这一过程,减少了数据准备的工作量。然而,这种简化也有代价:深度学习通常需要更多的数据才能表现良好。因此,寻找高效且可扩展的方式来收集数据,特别是对于大型语言模型(LLM),变得比以往任何时候都更加重要。

图1展示了机器学习数据收集的高层次概貌。社区可以通过去中心化的方式贡献的子主题以绿色文字标出。

任何人都可以通过生态系统中的两个dApp,Analytix 和 ,帮助整个DIN网络收集链上和链下数据。 网络会根据数据质量奖励数据收集节点(数据质量评估标准由网络自动确定,即通过验证节点的帮助实现)。 验证节点是无权限的,这确保了参与网络建设的人越多,整个网络就会越强大。

xData
Fig.1 landscape of data collection