- BI mendapat akses awal ke Manus, yang mengklaim sebagai agen AI yang sepenuhnya otonom di dunia.
- Ini menyusun tugas -tugas dengan baik tetapi tersandung dalam eksekusi – berhalusinasi data dan membuat desain yang kikuk.
- Begini caranya dalam menangkap opini publik tentang Doge, dan membangun startup dari awal.
Kami menguji Manusagen AI umum baru dari Cina, yang menjanjikan masa depan pembantu AI, yang membutuhkan pengawasan manusia minimal.
Sejak diluncurkan minggu lalu, telah dipuji oleh para ahli dan pengamat industri, dengan beberapa bahkan menyebutnya “yang kedua Deepseek. “
Untuk saat ini, Manus saat ini hanya diundangtetapi saya termasuk di antara sebagian kecil dari pengguna yang ditunggu -tunggu yang diberikan akses.
Saya ingin melihat apakah itu bisa memenuhi janjinya sebagai agen AI umum yang sepenuhnya otonom.
Inilah yang saya minta untuk dilakukan – dan bagaimana itu menangani tugas -tugas itu.
Platform Manus memberikan opsi untuk melakukan berbagai tugas. Manus yang Anda miliki
Tugas 1: Menganalisis sentimen doge dalam berita dan media sosial
Manus mengklaim dapat mengikis internet, menganalisis wacana publik, dan memetakan pergeseran sentimen real-time di media sosial dan situs berita.
Saya memintanya untuk menganalisis bagaimana publik bereaksi terhadap pemotongan tenaga kerja federal di bawah Departemen Efisiensi Pemerintah, atau Doge.
Dari tanggapan awalnya terhadap prompt saya, segalanya tampak menjanjikan.
Pada awalnya, Manus tampaknya memahami tugas tersebut. Manus yang Anda miliki
Tapi Manus tidak benar -benar mendapatkan memo itu.
Pertama, itu tidak dapat menemukan reaksi di media sosial – terlepas dari kenyataan bahwa pemotongan tenaga kerja federal telah menjadi berita utama selama berminggu -minggu.
Manus mengambil pendekatan “palsu sampai Anda membuatnya”. Manus yang Anda miliki
Alih -alih berhenti dan bertanya apakah saya menginginkan artikel berita nyata, itu alih -alih disimulasikan wacana publik tentang Doge.
Manus menunjukkan tugas yang sedang berlangsung. Manus yang Anda miliki
Lalu, itu menjadi lebih buruk.
Selama lima menit berikutnya, saya menyaksikannya menghasilkan reaksi dan akun media sosial palsu, tweet yang benar-benar dibuat-buat, dan bahkan menunjukkan situs web nyata membuat posting yang tampaknya tidak nyata.
Manus mensimulasikan set data, daripada menggunakan internet. Manus yang Anda miliki
Tidak ada titik yang bertanya apakah saya menginginkan ini. Saya tidak.
Ini berlangsung selama 20 menit. Ada opsi untuk masuk dan mengambil kendali, tetapi bagi saya tampaknya bertentangan dengan inti dari ini yang seharusnya menjadi agen yang sepenuhnya otonom yang mampu bekerja secara mandiri.
Laporan akhir menarik data palsu dari situs web nyata, termasuk pembayar pajak untuk akal sehat, digambarkan sebagai “organisasi pengawas konservatif fiskal dengan pengaruh keseluruhan tertinggi dalam liputan berita.”
Tetapi klaim Manus bahwa ini adalah suara yang paling berpengaruh di Doge dipertanyakan. Di antara sumber-sumber teratasnya adalah blog menengah yang disebut Progressive Times, yang belum menerbitkan apa pun sejak 2017-jauh sebelum Doge ada.
Sedangkan untuk tren sosial, Manus tampaknya telah memberikan pengguna X dan Reddit yang dibuat-buat dan mendaftarkannya sebagai mengemudi wacana online tentang Doge.
Dataset satu penukaran adalah visualisasi dari datasetnya – benar -benar palsu. Cara mengkategorikan sentimen, membuat prediksi, dan menghasilkan kerusakan visual sangat mengesankan.
Manus meramalkan bagaimana sentimen publik terhadap Doge akan berubah. Manus yang Anda miliki
Itu bisa berguna jika telah bekerja dengan data nyata. Tapi karena tidak, rasanya seperti cara yang sangat halus untuk menyajikan informasi yang sepenuhnya dibuat -buat.
Sekilas, laporan itu tampak sah, lengkap dengan daftar referensi yang meyakinkan. Tetapi hanya di akhir-terkubur dalam cetakan halus-adalah penafian yang mengatakan seluruh analisis 10 halaman adalah data sintetis.
Jika seseorang membutuhkan analisis sentimen yang nyata dan tidak secara aktif memantau tindakan agen, mereka akan berakhir dengan hasil yang tidak berguna.
Itu membuat saya sangat percaya diri masuk ke tugas berikutnya.
Tugas 2: Luncurkan bisnis untuk menyelesaikan kenaikan harga telur
Untuk tes ini, saya meminta Manus untuk mengembangkan startup untuk ditangani Harga telur yang menaikkan. Memang, permintaan saya ambisius: Saya ingin rencana bisnis, latar belakang pendiri, situs web yang dirancang penuh, pedoman merek, strategi pemasaran, dan bahkan logo dan kartu bisnis.
Dari saat saya mencapai pengembalian, Manus antusias, kewirausahaan, dan terorganisir – kontras yang mencolok dengan tes sebelumnya di mana ia membuat data, dan membutuhkan koreksi kursus yang konstan.
Kali ini, dimulai dengan awal yang mulus. Prosesnya tampak terstruktur dan metodis.
Manus membuat saya diperbarui di mana itu dengan tugas. Manus yang Anda miliki
Manus fantastis dalam menguraikan berbagai strategi, dan mengelola harapan di seluruh.
Manus memiliki pedoman merek, logo, dan rencana bisnis yang siap digunakan. Manus yang Anda miliki
Segalanya mencari!
Pembaruan lain yang berguna. Manus yang Anda miliki
Di tengah jalan, itu menawarkan untuk menunjukkan kepada saya kemajuan, mengungkapkan aset branding pertama untuk bisnis baru saya: Eggonomy ™, “platform penghematan telur langsung-ke-konsumen.”
Desain logo yang aneh dan cawan Petri terasa seperti telah diangkat dari halaman buku teks sains sekolah. Ini juga memberikan kartu nama dasar dengan slogan “telur tanpa guncangan harga.”
Visi Manus untuk bisnis telur saya. Manus yang Anda miliki
Tapi saya mengulurkan harapan. Mengingat skala tugas itu, saya berharap akan memakan waktu lebih lama, dan tampaknya tidak mengenai penghalang jalan teknis.
Prosesnya jelas, cepat, dan mudah diikuti – sampai tidak.
Kali ini, tidak ada masalah mengakses data web. Manus yang Anda miliki
Setelah setengah jam, Manus memberi tahu saya produk akhir, Eggonomy ™, sudah siap.
Saya terkejut dengan melihat situs web pertama, yang tampak bersih dan samar-samar terkait telur.
Situs web baru Eggonomy. Manus AI / Eggonomy
Tapi ada sesuatu yang salah.
Bagian blog menampilkan posting acak dan tidak terkait yang tidak ada hubungannya dengan telur.
Bisnis telur tampaknya menjadi renungan. Manus AI / Eggonomy
Tidak butuh waktu lama untuk mencari tahu mengapa. Egonomy sudah ada. Situs web tidak dihasilkan dari awal – dan terdaftar pada tahun 2016, menurut Layanan Pemeriksaan Domain.
Setidaknya strategi bisnis tampaknya didukung oleh data nyata dan riset pasar.
Manus yang melakukan analisis pesaing. Manus yang Anda miliki
Manus hebat dalam brainstorming nama merek, menyusun rencana bisnis, dan menganalisis pesaing utama – tetapi pelaksanaannya jauh.
Lebih buruk lagi, itu tidak transparan untuk mengangkat situs web yang ada – tidak seperti dalam tugas Doge, di mana setidaknya mengaku menggunakan data sintetis.
Manus belum siap untuk pergi solo
Manus sangat menarik untuk ditonton, tetapi untuk saat ini, itu jauh dari agen yang sepenuhnya otonom yang diklaimnya.
Yang mengatakan, dua tes yang saya lemparkan ke Manus tidak formal atau ilmiah. Di Benchmark Gaia – ukuran yang lebih kuat dari utilitas AI – Manus mengklaim mengungguli Openai Deepresearch dan GPT-4.
Meskipun belum siap untuk bekerja sendiri, itu masih merupakan versi awal dari alat ini.
Ini bisa menjadi asisten AI yang kuat jika stabil, meningkatkan keandalan data, dan berhenti mengada -ada. Untuk saat ini, ini lebih merupakan magang riset daripada operator yang sepenuhnya independen.
Manus tidak segera menanggapi permintaan Business Insider untuk memberikan komentar.