AI-ABC

AI Agent Benchmarkfor

The Universal Evaluation Framework for AI Agents across CEX and Web3 66 real-world tasks, 6 core dimensions, reproducible scoring framework.

ดูผลการประเมิน ↓GitHub · ชุดคำถาม & กฎการให้คะแนน

66+

การประเมินงาน

มิติหลัก

ตัวแทนที่เข้าร่วมการประกวด

รายเดือน

การอัปเดตประจำเดือน

มิติ

มิติการประเมิน

ครอบคลุมผู้ใช้ Crypto ทั้งหมด — ตั้งแต่การดำเนินการพื้นฐานของ CEX ไปจนถึงการสอบสวนบนบล็อกเชนที่ซับซ้อน ทั้งหมดสร้างขึ้นจากสถานการณ์จริง

10 งาน

CEX

การสั่งซื้อแบบสปอต, การเปิดและปิดสัญญา, การตรวจสอบการลงทุน, กลยุทธ์กริด, การโอนบัญชีและการวิเคราะห์พอร์ต.

10 งาน

DEX

การแลกเปลี่ยนบนเชน, การเปรียบเทียบสะพานข้ามเชน, การควบคุมการเลื่อน, การปรับแต่งเส้นทางหลายขั้นตอน และการประเมินความเสี่ยงของสัญญา。

10 งาน

กระเป๋าเงิน

การโอนข้ามหลายเชน, การประเมินค่า Gas ที่สำรองไว้, การตรวจสอบรูปแบบที่อยู่, การป้องกันการโอนผิดเชน และการโอนตามเงื่อนไข。

12 งาน

การวิเคราะห์ตลาด

ข้อมูลตลาดแบบเรียลไทม์, การวิเคราะห์ทางเทคนิค RSI / K Line, การตัดสินใจความสัมพันธ์ระหว่างปริมาณและราคา, การเปรียบเทียบหลายสกุลเงินและการเปรียบเทียบความผันผวน.

12 งาน

การวิจัยโครงการ

การวิเคราะห์เศรษฐศาสตร์โทเค็น, การตัดสินรอบการเล่าเรื่อง, การตรวจจับ Rug Pull, การเปรียบเทียบและรายงานการวิจัยคู่แข่ง.

12 งาน

การติดตามบนบล็อกเชน

การวิเคราะห์ที่อยู่และกำไรขาดทุน, การติดตามวาฬขนาดใหญ่, สัญญาณ Smart Money, การตรวจสอบความปลอดภัยของโปรโตคอล.

การดำเนินการพื้นฐาน

คำสั่งแบบทีละขั้นตอน มีเจตนาที่ชัดเจน เช่น ตรวจสอบยอดคงเหลือ, ดูราคาตลาด, สั่งซื้ออย่างง่าย

เงื่อนไขการดำเนินการ

มีการตรวจสอบล่วงหน้าหรือสาขาที่ผิดปกติ เช่น การบล็อกเมื่อยอดเงินไม่เพียงพอ การเติมข้อมูลพารามิเตอร์ และการระบุความเสี่ยงจากการเชื่อมโยงที่ผิดพลาด。

งานผสม

หลายขั้นตอน หลายข้อจำกัด ต้องใช้การวิเคราะห์และการชั่งน้ำหนัก เช่น เส้นทางข้ามโซ่ที่ดีที่สุด การโอนเงินเต็มจำนวนโดยรักษา Gas ไว้

ผลลัพธ์เดือนมีนาคม 2026

การจัดอันดับการประเมิน

รวมคะแนนที่ถ่วงน้ำหนักจาก 6 มิติหลัก การประเมินทั้งหมดใช้กลไกฉันทามติแบบสองโมเดล พร้อมด้วยการอนุญาโตตุลาการจากมนุษย์

#	ตัวแทน	ประเภท	คะแนนรวม	CEX	DEX	กระเป๋าเงิน	การวิเคราะห์ตลาด	การวิจัยโครงการ	การติดตามบนบล็อกเชน
1	GateAI Agent	AI ทั่วไป	83.1	89.7	82.4	61.5	86.8	92.3	83.5
2	Claude Agent（Gate for AI installed）	AI ทั่วไป	82.8	79.2	81.6	82.2	83.2	89.6	79.9
3	Codex Agent（Gate for AI installed）	AI ทั่วไป	81.2	80.6	72.8	79	81.5	86.8	84.4
4	AskSurf Agent	คริปโต เอไอ	77.5	75.8	75.8	57.5	83.7	95.4	83
5	Manus（Gate for AI installed）	AI ทั่วไป	74.3	74.5	74.5	77.3	73.7	78.4	68.1
6	Binance Agent	คริปโต เอไอ	70.1	59.7	72.3	63.9	69.4	80.3	72.6
7	Claude Agent	AI ทั่วไป	68.2	59.4	58.6	59	73.1	80.9	73.6
8	Bitget Agent	คริปโต เอไอ	62.2	66.1	44.5	48.9	72	80.3	57.2
9	Codex Agent	AI ทั่วไป	52.2	51.4	46.5	55	60.4	57	42.4

GateAI Agent83.1

Claude Agent（Gate for AI installed）82.8

Codex Agent（Gate for AI installed）81.2

Gate AI Agent ได้รับการจัดอันดับรวมเป็นอันดับหนึ่งในครั้งนี้ ในฐานะที่เป็น Agent ที่รวมเข้ากับการแลกเปลี่ยนอย่างลึกซึ้ง มันมีอันดับหนึ่งในสามมิติหลัก ได้แก่ การซื้อขาย CEX, การซื้อขาย DEX และการวิเคราะห์ตลาด การประเมินครั้งนี้รวม Agent ทั้งหมด 9 ตัว โดยมีหัวข้อที่ครอบคลุมการซื้อขาย CEX, การซื้อขาย DEX, การดำเนินการกระเป๋าเงิน, การวิเคราะห์ตลาด, การสำรวจบนบล็อกเชน และการวิจัยโครงการ 6 ฉาก โดยใช้กลไกการให้คะแนนแบบสองโมเดลและตรวจสอบโดยมนุษย์ Gate AI Agent แสดงให้เห็นถึงความสามารถดั้งเดิมใน Web3 ของมันภายใต้มาตรฐานนี้

กรอบการให้คะแนน

วิธีการประเมินผล

แต่ละคำถามจะถูกให้คะแนนอย่างอิสระตาม 2-3 มิติการให้คะแนน โดยใช้การตรวจสอบความเห็นร่วมกันของโมเดลคู่ และเกณฑ์ทั้งหมดรวมถึงน้ำหนักจะเปิดเผยอย่างสมบูรณ์

Intent & Parameter Alignment

Does the Agent correctly understand user intent? Are parameters like amount, direction, and trading pair accurately parsed? Are there misunderstandings (e.g., confusing 10U with 10 SOL)?

Execution Result Correctness

Does the Agent provide correct results? Are API calls, calculations, and outputs accurate and complete? Are there fabricated data or false execution claims?

การระบุและป้องกันความเสี่ยง

Can the Agent identify wrong-chain transfers, insufficient gas, rug tokens, and other dangerous operations? Does it correctly block when conditions aren't met rather than forcing execution?

Exception Compatibility & Expression

When encountering permission issues, zero balance, API errors, etc., can the Agent clearly explain the reason and provide next steps?

PASS

1.0

ตอบสนองทุกเกณฑ์การให้คะแนนอย่างสมบูรณ์

PARTIAL

0.6

ทิศทางถูกต้อง แต่การดำเนินการไม่สมบูรณ์

FAIL

0.0

ข้อผิดพลาด, การสร้างขึ้นหรือมีความเสี่ยงด้านความปลอดภัย

การตรวจสอบความเห็นของโมเดลคู่

Each task is scored independently by GPT-5.4 and Claude Sonnet 4.6, with scoring benchmarks fixed before testing and independent of Agent identity. Average scores are taken to avoid single-model bias.

คะแนนรวมที่มีน้ำหนัก

Each scoring dimension has explicit weights (e.g., intent alignment 35%, execution correctness 45%, security handling 20%), aggregated into task scores, then consolidated by dimension for Agent composite scores.

การประเมินหมวดหมู่ตัวแทน

เอเจนต์ Gate AI

Gate's native AI assistant with full access to Gate MCP and AI Skills capabilities

ตัวแทน AI ทั่วไป

Mainstream AI platforms' general Agents (e.g., Claude, ChatGPT) with Gate MCP installed

ตัวแทน Crypto AI ของบุคคลที่สาม

Industry's other Crypto-specific AI Agents

ดูชุดคำถามและกฎการให้คะแนนทั้งหมด →

รายละเอียดการประเมินหัวข้อ

รายละเอียดการประเมินตามหัวข้อ

คลิกที่หัวข้อใดก็ได้เพื่อดูคะแนนและมิติการให้คะแนนของแต่ละ Agent。

CEX

DEX

กระเป๋าเงิน

การวิเคราะห์ตลาด

การวิจัยโครงการ

การติดตามบนบล็อกเชน

cex_001L1ช่วยดูให้หน่อยว่าฉันมี USDT อยู่ในบัญชีสปอตของฉันเท่าไหร่100▾

ช่วยดูให้หน่อยว่าฉันมี USDT อยู่ในบัญชีสปอตของฉันเท่าไหร่

GateAI Agent100

Claude Agent（Gate for AI installed）95

Codex Agent（Gate for AI installed）82.5

AskSurf Agent36.5

Manus（Gate for AI installed）94

Binance Agent87.5

Claude Agent36.5

Bitget Agent77.5

Codex Agent36.5

คะแนนมิติ

การเข้าใจเจตนาของบัญชีถูกต้องหรือไม่ที่ระบุว่าเป็นการตรวจสอบยอดคงเหลือบัญชีสปอต แทนที่จะเป็นสินทรัพย์รวม ยอดคงเหลือสัญญาหรือการฝาก

ความถูกต้องของการตรวจสอบยอดคงเหลือมีการคืนยอดคงเหลือ USDT ที่มีอยู่จริงหรือไม่ ยอดเงินและหน่วยชัดเจน แยกแยะระหว่างยอดที่ใช้ได้/ยอดที่ถูกแช่แข็ง

การจัดการข้อผิดพลาดและคำอธิบายเมื่อพบปัญหาที่ไม่ได้เข้าสู่ระบบหรือการอนุญาตหมดอายุ จะมีการให้เหตุผลที่ชัดเจนและแนวทางถัดไปหรือไม่

cex_002L1คำสั่งซื้อในราคาตลาด 10U ของ SOL89▾

คำสั่งซื้อในราคาตลาด 10U ของ SOL

GateAI Agent89

Claude Agent（Gate for AI installed）72.5

Codex Agent（Gate for AI installed）87.5

AskSurf Agent77.5

Manus（Gate for AI installed）90

Binance Agent67.5

Claude Agent77.5

Bitget Agent42.5

Codex Agent36.5

คะแนนมิติ

การวิเคราะห์คำสั่งถูกต้องหรือไม่เข้าใจว่า 10U เป็นจำนวนเงิน USDT ไม่ใช่จำนวน 10 SOL

การดำเนินการซื้อขายอย่างครบถ้วนมีการส่งคืนผลการทำธุรกรรม, ขั้นตอนการยืนยันหรือคำอธิบายสถานะการสั่งซื้อที่ชัดเจนหรือไม่

การระบุและป้องกันความเสี่ยงเมื่อยอดเงินไม่เพียงพอหรือสิทธิ์ถูกจำกัด มีการปิดกั้นอย่างถูกต้องและแจ้งผู้ใช้เกี่ยวกับขั้นตอนถัดไปหรือไม่

cex_003L1USDT ของผลิตภัณฑ์การลงทุนมีอัตราผลตอบแทนต่อปีเท่าไหร่95▾

USDT ของผลิตภัณฑ์การลงทุนมีอัตราผลตอบแทนต่อปีเท่าไหร่

GateAI Agent95

Claude Agent（Gate for AI installed）87.5

Codex Agent（Gate for AI installed）91

AskSurf Agent77.5

Manus（Gate for AI installed）72.5

Binance Agent65

Claude Agent77.5

Bitget Agent69

Codex Agent42.5

คะแนนมิติ

ผลิตภัณฑ์ที่ระบุขอบเขตมุ่งเน้นไปที่ผลิตภัณฑ์การเงิน/การทำเงินประเภท USDT แทนที่จะเน้นไปที่การซื้อขายหรือการกู้ยืม

ผลลัพธ์ที่มีประสิทธิภาพมีการคืนค่าผลิตภัณฑ์การลงทุน USDT ที่มีประสิทธิภาพอย่างน้อยหนึ่งประเภทและอัตราผลตอบแทนต่อปีหรือไม่

คำอธิบายผลตอบแทนและข้อจำกัดระบุลักษณะการเปลี่ยนแปลงของอัตราผลตอบแทนหรือข้อจำกัดด้านคุณสมบัติ/พื้นที่

cex_004L1ช่วยหาผู้ขายที่รองรับ Alipay เพื่อซื้อ 5000 USDT หน่อยค่ะ100▾

ช่วยหาผู้ขายที่รองรับ Alipay เพื่อซื้อ 5000 USDT หน่อยค่ะ

GateAI Agent100

Claude Agent（Gate for AI installed）47.5

Codex Agent（Gate for AI installed）60

AskSurf Agent77.5

Manus（Gate for AI installed）55

Binance Agent40

Claude Agent36.5

Bitget Agent42.5

Codex Agent71.5

คะแนนมิติ

P2P สถานการณ์การระบุถูกต้องหรือไม่ที่ระบุว่าเป็นการซื้อเหรียญด้วยเงิน法币 P2P, ดึงข้อมูลสามพารามิเตอร์คือ Alipay, 5000 บาท, USDT

คุณภาพผลการจับคู่มีการส่งคืนรายการโฆษณาที่ตรงตามเงื่อนไขหรือแผนการซื้อที่สามารถดำเนินการได้หรือไม่

การอธิบายการบล็อกและความเสี่ยงเมื่อไม่มีโฆษณาหรือคุณสมบัติไม่เพียงพอ มีการให้เหตุผลที่ชัดเจนและแนวทางถัดไปหรือไม่

cex_005L2ทำการขายชอร์ต ETH90▾

ทำการขายชอร์ต ETH

GateAI Agent90

Claude Agent（Gate for AI installed）92.5

Codex Agent（Gate for AI installed）82.5

AskSurf Agent36.5

Manus（Gate for AI installed）75

Binance Agent71.5

Claude Agent52.5

Bitget Agent52.5

Codex Agent36.5

คะแนนมิติ

เข้าใจทิศทางการซื้อขายการระบุว่าการเปิด Short ETH เป็นการเปิดสัญญาแบบถาวร (Perpetual Contract) ไม่ใช่การขายสินค้าจริง (Spot) ถูกต้องหรือไม่

การเติมเต็มพารามิเตอร์และแผนเมื่อขาดพารามิเตอร์จะมีการสอบถามอย่างกระตือรือร้นหรือไม่ แผนสุดท้ายมีการรวมทิศทาง/เลเวอเรจ/มาร์จิ้นหรือไม่

การดำเนินการปิดวงจรและการบล็อกเมื่อมีพารามิเตอร์ครบถ้วนแล้ว สามารถให้แผนการดำเนินการที่สามารถปฏิบัติได้หรือไม่ และการบล็อกจะถูกต้องหรือไม่เมื่อมีข้อจำกัดด้านเวลา

cex_006L2ช่วยปิดสถานะ Long ของ BTC ให้หน่อย72.5▾

ช่วยปิดสถานะ Long ของ BTC ให้หน่อย

GateAI Agent72.5

Claude Agent（Gate for AI installed）96

Codex Agent（Gate for AI installed）95

AskSurf Agent52.5

Manus（Gate for AI installed）82.5

Binance Agent51.5

Claude Agent36.5

Bitget Agent89

Codex Agent61.5

คะแนนมิติ

การรับรู้ความหมายของการปิดสถานะถูกต้องหรือไม่ที่ระบุว่าเป็นการปิดสถานะซื้อ/ขายออก แทนที่จะเป็นการเปิดสถานะขายสั้น

การตรวจสอบสถานะการถือครองและผลลัพธ์ควรตรวจสอบสถานะการถือครอง BTC แบบ Long ก่อนแล้วจึงให้ผลลัพธ์การปิดสถานะหรือยืนยันขั้นตอนถัดไป

ความเสี่ยงและการจัดการข้อผิดพลาดในกรณีที่ไม่มีตำแหน่งหรือสิทธิ์ไม่เพียงพอ เป็นต้น ควรให้คำอธิบายที่ถูกต้องหรือไม่

cex_007L2โอน 10 USDT จากบัญชีสปอตไปยังบัญชีสัญญาถาวร90▾

โอน 10 USDT จากบัญชีสปอตไปยังบัญชีสัญญาถาวร

GateAI Agent90

Claude Agent（Gate for AI installed）94

Codex Agent（Gate for AI installed）92.5

AskSurf Agent71.5

Manus（Gate for AI installed）92.5

Binance Agent71.5

Claude Agent67.5

Bitget Agent69

Codex Agent52.5

คะแนนมิติ

การตรวจสอบความถูกต้องของเส้นทางการโอนสามารถระบุได้ถูกต้องว่าเป็นการโอนภายใน โดยทิศทางคือจากบัญชีสปอตไปยังบัญชีสัญญาถาวร

ดำเนินการหรือบล็อกผลลัพธ์ให้คำอธิบายสถานะเมื่อการโอนสำเร็จ และเมื่อยอดเงินไม่เพียงพอจะบล็อกได้อย่างถูกต้องหรือไม่

ความชัดเจนของข้อมูลทิศทางบัญชี, จำนวนเงิน, สาเหตุที่ผิดปกติมีการแสดงออกชัดเจนหรือไม่

cex_008L2ETH ตกลงมาที่ 2500 เมื่อไหร่ให้ซื้อ 100U75▾

ETH ตกลงมาที่ 2500 เมื่อไหร่ให้ซื้อ 100U

GateAI Agent75

Claude Agent（Gate for AI installed）62.5

Codex Agent（Gate for AI installed）70

AskSurf Agent62.5

Manus（Gate for AI installed）59

Binance Agent37.5

Claude Agent77.5

Bitget Agent62.5

Codex Agent62.5

คะแนนมิติ

ประเภทคำสั่งการระบุมีการระบุว่าเป็นคำสั่งซื้อที่มีราคาจำกัดเมื่อถึงราคา หรือไม่ใช่คำสั่งซื้อที่มีราคาตลาดที่ทำการซื้อขายทันที

ความถูกต้องของพารามิเตอร์สกุลเงิน ETH, ราคาเป้าหมาย 2,500, จำนวน 100U สามพารามิเตอร์หลักนี้ถูกต้องหรือไม่

ดำเนินการปิดวงจรมีการให้สถานะการยืนยัน/การดำเนินการหรือไม่, ในกรณีที่มีข้อจำกัดมีการบล็อกที่ถูกต้องหรือไม่

cex_009L3ช่วยวิเคราะห์ให้หน่อยว่าบัญชีรวมของฉันในช่วง 30 วันที่ผ่านมาได้ทำผลตอบแทนดีกว่า BTC หรือไม่ และขอให้ดูอัตราการชนะและอัตราส่วนกำไรขาดทุนของ USDT perpetual ด้วย90▾

ช่วยวิเคราะห์ให้หน่อยว่าบัญชีรวมของฉันในช่วง 30 วันที่ผ่านมาได้ทำผลตอบแทนดีกว่า BTC หรือไม่ และขอให้ดูอัตราการชนะและอัตราส่วนกำไรขาดทุนของ USDT perpetual ด้วย

GateAI Agent90

Claude Agent（Gate for AI installed）85

Codex Agent（Gate for AI installed）77.5

AskSurf Agent77.5

Manus（Gate for AI installed）49

Binance Agent27.5

Claude Agent62.5

Bitget Agent77.5

Codex Agent77.5

คะแนนมิติ

การวิเคราะห์ขอบเขตครอบคลุมทั้งสองมิติของการวิเคราะห์บัญชีที่ทำกำไรจาก BTC และการซื้อขายแบบถาวรหรือไม่

ผลลัพธ์และความถูกต้องของดัชนีมีการให้ข้อสรุปว่าได้ทำผลงานดีกว่า BTC หรือไม่ รวมถึงอัตราชนะและอัตราส่วนกำไรขาดทุนหรือไม่

การกำหนดขอบเขตและการจัดการข้อผิดพลาดมีความชัดเจนในการแยกประเภทของขอบเขตการวิเคราะห์สองประเภทหรือไม่ และเมื่อไม่มีข้อมูล ควรระบุข้อจำกัดแยกต่างหากหรือไม่

cex_010L3ใช้ 100 USDT เปิดกริดสปอต BTC95▾

ใช้ 100 USDT เปิดกริดสปอต BTC

GateAI Agent95

Claude Agent（Gate for AI installed）60

Codex Agent（Gate for AI installed）67.5

AskSurf Agent77.5

Manus（Gate for AI installed）75

Binance Agent77.5

Claude Agent69

Bitget Agent79

Codex Agent36.5

คะแนนมิติ

ประเภทของกลยุทธ์ที่ระบุถูกต้องหรือไม่ที่ระบุว่าเป็นกริดสปอต BTC แทนที่จะเป็นกริดสัญญาหรือกลยุทธ์เชิงปริมาณอื่น ๆ

ความถูกต้องของพารามิเตอร์แผนสามารถสะท้อน BTC, 100 USDT, และสามองค์ประกอบของกริดสปอตได้อย่างถูกต้องหรือไม่

การอธิบายการบล็อกและการจำกัดเมื่อยอดเงินไม่เพียงพอหรือกลยุทธ์ไม่สามารถใช้งานได้ จะมีการให้เหตุผลที่ชัดเจนหรือไม่

คำถามที่พบบ่อย

What is AI-ABC?+

AI-ABC (AI Agent Benchmark for Crypto) is the industry's first standardized evaluation framework specifically designed for AI Agents in Crypto scenarios. It covers 6 dimensions: CEX trading, DEX operations, wallet management, market analysis, project research, and on-chain tracking. Using 66+ real-world tasks based on actual user scenarios, it employs reproducible scoring mechanisms to benchmark various AI Agents across CEX and Web3.

How is this different from GAIA and AgentBench?+

Existing evaluation frameworks like GAIA and AgentBench focus on general scenarios without Crypto-specific tasks. AI-ABC's tasks are all based on real Crypto operations — from 'buy $10 of SOL at market price' to 'bridge 1000 USDC and swap to ETH with slippage control' — including many operation-based tasks requiring real API calls to exchanges, wallet interfaces, and on-chain data. This is completely beyond the scope of general benchmarks.

Benchmark ทำการให้คะแนนอย่างไร?+

คะแนนจะขึ้นอยู่กับการแสดงผลของ AI Agent ในงานจริงมากกว่า 66 งาน โดยพิจารณาจากความสำเร็จในการทำงาน ความถูกต้อง และประสิทธิภาพในการดำเนินการเป็นหลัก เพื่อให้แน่ใจว่าผลการประเมินมีความเป็นกลาง ยุติธรรม และสามารถเปรียบเทียบได้

ข้อมูลการประเมินจะอัปเดตบ่อยแค่ไหน?+

การอัปเดตประจำเดือน เมื่อ Agent แต่ละตัวมีการปรับปรุงและมี Agent ใหม่เข้าร่วม เราจะดำเนินการประเมินผลอย่างต่อเนื่องและอัปเดตอันดับ รายการคำถามจะมีการขยายตามการพัฒนาในอุตสาหกรรมและสถานการณ์ใหม่ ๆ ด้วย

การให้คะแนนมีความเป็นกลางหรือไม่? Gate AI มีส่วนร่วมในการประเมินผลอย่างยุติธรรมหรือไม่?+

Scoring benchmarks are fixed before testing and independent of Agent identity. Evaluations use dual-model consensus (GPT-5.4 and Claude Sonnet 4.6 score independently), with average scores taken to avoid single-model bias. All scoring dimensions, weights, and task benchmarks are publicly available on GitHub for anyone to reproduce.

การแบ่งระดับความยากของภารกิจการประเมินผลทำได้อย่างไร?+

แบ่งออกเป็นสามระดับ — L1 (การดำเนินการพื้นฐาน: คำสั่งทีละขั้นตอน, เจตนาชัดเจน), L2 (การดำเนินการตามเงื่อนไข: มีการตรวจสอบล่วงหน้าหรือสาขาที่ผิดปกติ), L3 (งานที่ซับซ้อน: หลายขั้นตอน, หลายข้อจำกัด, ต้องการการอนุมานและการชั่งน้ำหนัก) ความยากยิ่งสูงขึ้น ยิ่งสามารถแสดงถึงความสามารถในการตัดสินใจรวมของ Agent ในสถานการณ์ Crypto ที่แท้จริงได้มากขึ้น

AI ตัวแทนทั่วไปและตัวแทนเฉพาะทาง Crypto มีความแตกต่างหลัก ๆ ดังนี้:+

เอเจนต์ AI ทั่วไป (เช่น Claude, ChatGPT) แสดงผลลัพธ์ใกล้เคียงกับเอเจนต์เฉพาะทางในงานประเภทการค้นหาข้อมูล (การวิเคราะห์ตลาด, การวิจัยโครงการ) แต่มีความแตกต่างอย่างชัดเจนในงานประเภทการดำเนินการที่ต้องทำจริง (การสั่งซื้อการซื้อขาย, การโอนเงินบนบล็อกเชน, การประเมิน Gas และการบล็อกการส่งข้อมูลผิด) นี่คือเหตุผลหลักที่ Crypto ต้องการโครงสร้างพื้นฐาน AI เอเจนต์เฉพาะทาง.