보상 메커니즘
最后更新于
最后更新于
DIN 프로토콜의 인센티브 메커니즘은 데이터 제출을 통해 모델의 정확도를 향상시키는 기여자, 데이터의 정확성을 검증하는 검증자, 그리고 데이터셋을 벡터로 변환하는 컴퓨팅 노드를 장려합니다.
이 인센티브 메커니즘은 시스템 내에서 "Wafer"라고 불리는 게임화된 포인트와 예측 시장에 기반한 방법론을 결합한 형태입니다.
데이터 기여자에게는, 테스트 데이터로 측정된 모델 성능 향상 정도에 따라 보상이 주어집니다. 이를 통해 참여자들은 모델 개선에 기여할수록 더 많은 보상을 받게 되며, 프로토콜 전체의 정확도와 효율성을 높이는 데 기여하게 됩니다.
그림 1에서 볼 수 있듯이, 전체 과정은 세 가지 단계로 구성되어 있습니다.
약속 단계에서는 제공자가 보상을 예치하고 손실 함수 L(h, D)를 정의합니다. 이 함수는 모델의 손실을 특정 데이터셋 D에 대해 측정합니다(일반적으로 데이터셋의 포인트들에 대한 평균 손실). 마지막으로 제공자는 테스트 데이터셋을 암호화하여 네트워크에 제출하고, 이 데이터셋의 일부는 처음에 무작위로 공개됩니다.
참여 단계에서는 사람들이 데이터를 추가하거나 모델을 업데이트합니다. 각 참가자는 업데이트와 함께 네트워크 토큰의 일부를 스테이킹해야 합니다. 최대 시간 제한이나 데이터 양과 같은 종료 조건이 충족되면 이 단계가 끝납니다. 제공자가 새로운 테스트 데이터를 약속하면 새로운 사이클을 시작할 수 있습니다.
보상 단계에서는 제공자가 테스트 데이터셋을 업로드하고, 스마트 계약이 약속을 충족하는지 확인합니다. 그런 다음 스마트 계약은 모든 참가자에 대한 보상을 결정합니다.
보상 계산
우선, 보상 B = 1이라고 가정합시다. 그러면 각 참가자의 보상은 그들의 스테이킹에 다음의 수를 더한 값이 됩니다.:
이 보상 함수는 자동화된 시장 조성자 또는 점수 기반 예측 시장에 기반하여 제안됩니다. 이를 다음과 같이 시각화할 수 있습니다: 스마트 계약은 먼저 첫 번째 참가자에게 L(h₀, D)를 지급합니다. 그들의 데이터는 모델을 h₁로 업데이트하며, 두 번째 참가자는 L(h₁, D)를 지불하게 됩니다. 이 과정은 마지막 참가자가 L(hₜ, D)를 스마트 계약에 지급할 때까지 계속됩니다. hₜ가 이전 모델보다 성능이 좋을수록, 더 적은 참가자 수 t가 이후에 지불해야 하므로, 참가자들은 (예상) 테스트 세트에 비해 가능한 유용한 데이터를 제공하도록 유도됩니다. 만약 hₜ가 이전 모델보다 성능이 떨어지면, t는 일부 또는 전체 스테이킹을 잃게 됩니다. 결과적으로, 스마트 계약은 모든 기여로부터의 총 개선분인 L(h₀, D)−L(hₜ, D)를 지급합니다. 이 값은 손실 함수에 대한 가정에 따라 최대 1까지입니다.
마지막으로, 이 메커니즘을 보상 B에 맞게 조정해야 합니다. J.D. Abernethy가 제안한 접근 방식은 모든 참가자가 B만큼 스테이킹해야 하므로 현실적으로 실행하기 어렵습니다. 따라서 이 메커니즘을 B번 반복하는 방법을 채택합니다. 각 반복에서 참가자는 일정량의 토큰을 스테이킹하고 보상을 받습니다. 만약 참가자가 손실로 인해 더 이상 토큰을 스테이킹할 수 없다면 탈퇴하게 됩니다. 비록 이 과정이 다소 복잡할 수 있지만, hₜ의 성능이 좋을수록 t가 받는 보상도 많아지므로, 참가자들에게 제공되는 인센티브는 매우 잘 맞아떨어진다고 할 수 있습니다.
coming soon..