Microsoft AI (MAI), laboratorium riset milik Microsoft, resmi merilis tiga model AI terbaru yang bernama MAI-Transcribe-1, MAI-Voice-1, dan MAI-Image-2.
Kehadiran tiga model ini menunjukkan ambisi Microsoft untuk membangun teknologi AI yang lebih mandiri, sekaligus agar bisa bersaing langsung dengan laboratorium AI lainnya.
Apa yang ditawarkan?
Di tengah pasar LLM (Large Language Model) yang makin ramai, Microsoft menawarkan keunggulan pada aspek biaya dan kecepatan. Model-model baru ini pun diposisikan lebih murah ketimbang solusi dari Google dan OpenAI.
Dengan demikian, model ini bisa menjadi opsi yang lebih efisien bagi perusahaan yang ingin mengintegrasikan kemampuan teks, suara, dan video.
"Di Microsoft AI, kami membangun Humanist AI. Kami memiliki pandangan yang berbeda ketika membuat model AI kami, meletakkan manusia sebagai inti, mengoptimalkan cara orang berkomunikasi, dan melatihnya untuk penggunaan praktis," tutur CEO AI Mustafa Suleyman.
Model baru dari Microsoft AI
- Kecepatan transkripsi: MAI-Transcribe-1 mendukung 25 bahasa dan diklaim 2,5 kali lebih cepat dibandingkan layanan Azure Fast milik Microsoft sendiri. Biayanya sekitar USD 0,36 per jam.
- Audio Instan: MAI-Voice-1 mampu menghasilkan 60 detik audio hanya dalam waktu 1 detik, serta memungkinkan pengguna membuat suara kustom. Estimasi harganya USD 22 per 1 juta karakter.
- Video Generative: Meski bernama "Image-2", model ini sebenarnya adalah generator video yang dikembangkan oleh tim Superintelligence Microsoft. Layanan ini kira-kira dibanderol USD 33 per 1 juta token output.
Pax insight
Ketiga model ini sekarang tersedia melalui Microsoft Foundry, sedangkan model transkripsi dan suara juga dapat diuji di MAI Playground. Microsoft juga berencana merilis lebih banyak model lagi yang akan diintegrasikan langsung dalam produk.



