Belakangan ini saya melakukan pertarungan multi-model dan menemukan sesuatu yang cukup menarik.


Untuk satu masalah arsitektur yang sama, saya meminta Claude dan Codex menulis solusi secara terpisah.
Codex melewatkan satu hal: strategi saya tersebar di lebih dari 20 proses independen, dan solusi yang dia buat secara default menganggap "semua komponen berjalan di tempat yang sama", jadi langsung tidak valid. Claude dengan cepat melihat masalah ini.
Sebaliknya, Claude melewatkan hal lain: dia berkeras untuk membuat modul baru secara terpisah, padahal saya sudah memiliki satu rangka kerja lengkap yang bisa langsung dipakai, cukup menambahkan satu field. Codex kemudian memperbaiki hal ini.
Yang paling menarik adalah langkah berikutnya: saya meminta kedua model saling meninjau solusi akhir satu sama lain, dan keduanya secara tidak sadar menganggap "kerangka kerja yang sudah dibuat pihak lain" sebagai dasar, sehingga keduanya melewatkan satu kondisi batas—yang akhirnya saya temukan sendiri saat menjalankan data produksi secara manual.
Jadi sekarang kebiasaan saya adalah: setiap putaran pertarungan model, berikan standar keberhasilan yang independen, dan larang satu model melihat draft dasar model lain. Yang didapat adalah dua draft independen yang tidak memiliki blind spot yang sama, baru kemudian digabungkan agar mendekati solusi lengkap.
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan