2024-12-23 08:15:18 OpenAI o3 dan o3-mini, model AI yang mampu menyelesaikan sebuah persoalan dengan cara berpikir yang lebih logis, mirip seperti manusia.
Beritasaja.com - perusahaan pembuat chatbot ChatGPT, resmi mengumumkan dua model kecerdasan buatan (artificial intelligence/AI) terbarunya, dan .
o3 dan o3-mini merupakan yang memiliki kemampuan bernalar (reasoning).
Dengan kemampuan ini, kedua model AI tersebut diklaim mampu menyelesaikan sebuah persoalan dengan cara berpikir yang lebih logis, mirip seperti manusia.
Seperti namanya, o3 merupakan suksesor dari o1 yang diperkenalkan September lalu.
Kemudian o3-mini adalah model AI reasoning versi lebih ringan dan lebih murah dari o3, sekaligus merupakan penerus dari o1-mini.
Dalam sejumlah pengujian internal, OpenAI mengeklaim o3 jauh lebih pintar dari o1 untuk menyelesaikan berbagai persoalan matematika.
Salah satunya adalah kompetisi matematika level "dewa" alias internasional, American Invitational Mathematics Exam (AIME) 2024.
Pada pengujian AIME 2024, o3 disebut mampu menyelesaikan hampir semua soal di kompetisi ini dengan nilai 96,7 persen (hanya salah satu soal).
Di sisi lain, o1 hanya mampu mendapatkan skor 83,3 persen untuk pengujian serupa.
Baca juga:
o3-mini, dalam mode penalaran "High", juga diklaim lebih jago menjawab soal-soal AIME 2024 dibanding o1 dan o1-mini dengan skor 83,6 persen.
o1-mini sendiri memiliki skor akhir 63,6 persen.
Selain pengujian soal AIME 2024, OpenAI juga mengeklaim o3 dapat menjawab berbagai soal sains di level universitas yang tergabung dalam kelompok soal GPQA Diamond.
Di pengujian ini, o3 mendapatkan skor 87,7 persen.
o3, lanjut OpenAI, juga unggul di beberapa pengujian alias benchmark populer yang berkaitan dengan reasoning.
Beberapa di antaranya seperti SWE-Bench Verified (programming) dengan skor 22,8 poin, Codeforces (coding) dengan skor 2.727 poin, serta Frontier Math milik EpochAI dengan kemampuan penyelesaian soal 25,2 persen.
Di luar aneka benchmark di atas, o3 juga disebut memiliki performa nyaris sempurna untuk pengujian kebolehan Artificial General Intelligence (AGI), yaitu ARC-AGI.
Pengujian ini biasanya dipakai untuk mengetes apakah AI dapat memiliki kemampuan pola pikir seperti manusia atau tidak.
Dalam skala 0-100 persen, o3 memiliki skor performa ARC-AGI mencapai 76 persen untuk mode "Low" dan 88 persen untuk mode "High".
Di sisi lain, o1 dalam hanya memiliki skor berkisar di angka 20-30 persen untuk berbagai mode, dari Low hingga High.
Baca juga:
Tidak lebih cepat dari GPT-4o dan o1
Secara umum, model AI reasoning akan merespons pertanyaan atau kueri pengguna lebih lama dari model AI "reguler".
Hal ini disebabkan karena o3 sejatinya akan berpikir dan menghitung berulang kali sebelum mereka menjawab respons dari pengguna.
Ketika dibandingkan, o3 untuk mode High akan merespons pengguna 23 detik setelah kueri diterima.
Pada ChatGPT yang memakai GPT-4o, proses ini hanya akan berlangsung sekitar 0,5 detik.
Perangkat wearable, seperti smartwatch dan fitness tracker, mempermudah aktivitas sehari-hari dengan fungsi cerdas, kesehatan, dan produktivitas.
Meta mengumumkan akan menyetop dukungan WhatsApp di beberapa ponsel (HP) dengan sistem operasi (OS) Android lawas pada 1 Januari 2025 mendatang.
PSM Makassar memberi penjelasan resmi terkait insiden 12 pemain di lapangan saat laga pekan ke-16 Liga 1 2024-2025 melawan Barito Putera.
Berita peristiwa Beritasaja, kabar terbaru hukum pidana, kriminal hingga sosial budaya dan pendidikan, kasus korupsi, kecelakaan dan bencana alam
Dewi Paramita menjadi sorotan ketika Ibrahim Risyad menikah dengan Salshabilla Adriani pada Juli 2024 lalu.
Untuk merayakan hari Natal 2024, pengguna bisa membagikan gambar selamat Natal 2024. Ada banyak gambar Natal 2024 yang menarik.
Galeri Nasional Indonesia (GNI) mengumumkan bahwa Pameran Tunggal Yos Suprapto bertajuk Kebangkitan: Tanah untuk Kedaulatan Pangan, terpaksa ditunda. Mengapa begitu?
Black Shark merilis arloji pintar terbarunya, GS3 Sport. Smartwatch ini dirancang agar baterainya tahan lama untuk aktivitas di luar ruangan.
Selain Harvey Moeis, beberapa terdakwa lainnya yang terseret kasus korupsi timah juga akan menjalani sidang pembacaan putusan hakim hari ini.
Pemerintah Albania juga akan membuat suatu program yang memudahkan para orangtua untuk memantau anak-anaknya di internet.
"Berita Saja" adalah pilihan yang tepat bagi mereka yang mencari sumber berita yang dapat diandalkan dan informatif. Dengan berbagai fitur dan komitmennya terhadap kualitas, "Berita Saja" telah membangun reputasi sebagai platform berita yang patut dicontoh. Kunjungi situsnya hari ini dan tetaplah terinformasi dengan berita terbaru dari sumber yang terpercaya..
Copyright ©2021 Beritasaja.com