Google memperkenalkan Gemini 3.1 Flash TTS, model text-to-speech terbaru yang menghadirkan kontrol lebih detail terhadap gaya suara, tempo, hingga emosi.
Fitur ini memungkinkan pengguna menyisipkan perintah langsung dalam teks untuk mengatur bagaimana AI berbicara, membuat hasil audio terasa lebih natural dan fleksibel.
Yang paling menonjol adalah penggunaan audio tags, di mana instruksi seperti nada atau kecepatan bisa ditulis langsung di dalam teks. Beberapa poin penting:
OpenAI memperluas kemampuan Codex menjadi asisten yang jauh lebih fleksibel, tidak lagi terbatas pada coding.
Kini, Codex mampu terhubung dengan berbagai aplikasi di Mac, mengakses tools tambahan, hingga menjalankan tugas berulang secara otomatis sesuai kebiasaan pengguna.
Perubahan ini membuat Codex terasa seperti workflow engine berbasis AI yang terus belajar dari interaksi. Beberapa hal menarik yang menonjol:
OpenAI menghadirkan GPT-Rosalind, model reasoning terbaru yang dirancang khusus untuk mendukung penelitian di bidang biologi, penemuan obat, hingga translational medicine.
Model ini difokuskan untuk membantu ilmuwan memahami hubungan kompleks dalam data biologis serta mempercepat proses analisis yang biasanya memakan waktu lama.
Menariknya, GPT-Rosalind tidak hanya menjawab, tetapi mampu menalar dan menghubungkan berbagai konsep ilmiah secara lebih mendalam. Beberapa poin penting:
Perplexity AI resmi memperkenalkan fitur baru bernama Personal Computer yang terintegrasi langsung dengan aplikasi Mac mereka.
Fitur ini memungkinkan orkestrasi aman antara file lokal, aplikasi native, dan browser dalam satu alur kerja, sehingga pengguna bisa mengakses dan mengelola data tanpa harus berpindah-pindah platform.
Peluncuran ini mulai tersedia hari ini untuk pengguna Perplexity Max serta mereka yang sudah masuk daftar tunggu. Hal menarik dari fitur ini:
Google memperkenalkan pengalaman baru di Google Chrome yang memungkinkan pengguna membuka halaman web berdampingan dengan AI Mode.
Fitur ini dirancang agar pengguna bisa langsung membandingkan informasi dan mengajukan pertanyaan lanjutan tanpa harus bolak-balik tab, sehingga alur pencarian terasa lebih cepat dan tetap kontekstual.
Beberapa hal yang menonjol:
Artificial IntelligenceAnthropic resmi memperkenalkan Claude Opus 4.7 sebagai model terbaru yang difokuskan pada peningkatan kemampuan reasoning, akurasi, dan efisiensi dalam menangani tugas kompleks.
Model ini diklaim lebih stabil dalam percakapan panjang serta mampu memahami konteks secara lebih dalam, terutama untuk kebutuhan coding, analisis data, dan penulisan teknis.
Beberapa hal menarik dari rilis ini:
Platform diagram populer draw.io kini secara resmi meluncurkan integrasi melalui protokol MCP yang memungkinkan kecerdasan buatan menyusun visualisasi teknis secara otomatis.
Dengan teknologi ini, pengguna cukup memberikan perintah teks kepada AI untuk memilih ikon yang tepat dan menyambungkan garis antar komponen, menghasilkan diagram profesional yang tetap bisa disunting secara bebas dalam hitungan detik.
Langkah ini membuka akses gratis bagi siapa saja untuk membangun arsitektur kompleks tanpa harus menyusun setiap elemen secara manual dari awal. Beberapa detail menarik yang ditawarkan dalam pembaruan ini meliputi:
Google memperkenalkan Vibe Coding XR, workflow rapid prototyping baru yang menggabungkan Gemini Canvas dengan framework XR Blocks untuk mengubah prompt pengguna menjadi aplikasi WebXR interaktif.
Sistem ini dirancang agar kreator bisa lebih cepat menguji pengalaman spatial yang cerdas dengan dukungan physics-aware interaction sejak tahap awal.
Yang membuat update ini menarik adalah fokusnya pada pembuatan prototipe tanpa proses coding panjang, sehingga ide untuk XR, simulasi, atau pengalaman 3D interaktif bisa langsung divisualisasikan dari prompt. Sorotan pentingnya:
Artificial Intelligence
Artificial Intelligence
Artificial Intelligence
Artificial IntelligenceMeta Superintelligence Labs baru saja meluncurkan Muse Spark, model pertama dari lini keluarga Muse yang dirancang dengan kemampuan penalaran multimodal sejak awal.
Teknologi ini tidak hanya memahami teks, tetapi juga memiliki kemampuan visual chain of thought yang memungkinkannya berpikir secara sistematis saat memproses gambar serta mampu mengoperasikan berbagai perangkat eksternal secara mandiri untuk menyelesaikan tugas yang kompleks.
Model mutakhir ini sudah bisa langsung dicoba melalui platform meta.ai dan aplikasi Meta AI untuk membantu pengguna dalam berbagai aktivitas kreatif maupun teknis. Kehadiran Muse Spark menandai langkah besar Meta dalam pengembangan agen kecerdasan buatan yang lebih kolaboratif. Berikut adalah beberapa hal istimewa yang dibawa oleh model ini:
Anthropic secara resmi meluncurkan Claude Managed Agents, sebuah solusi komprehensif yang dirancang untuk membantu pengembang membangun dan meluncurkan agen kecerdasan buatan dalam skala besar secara instan.
Platform ini menggabungkan infrastruktur produksi yang tangguh dengan sistem manajemen performa tinggi, sehingga proses transisi dari sekadar purwarupa menjadi aplikasi siap pakai hanya membutuhkan waktu beberapa hari saja.
Layanan ini kini telah tersedia dalam versi beta publik di platform Claude, memungkinkan siapa saja untuk menciptakan asisten digital yang mampu menangani tugas-tugas rumit secara otonom. Berikut adalah beberapa poin menarik mengenai fitur baru ini:
Model bahasa besar terbaru bernama GLM-5.1 telah resmi diluncurkan dengan pencapaian yang mengesankan sebagai pemuncak peringkat dalam ekosistem sumber terbuka. \
Keunggulan utamanya terletak pada kemampuan menyelesaikan tugas pemrograman yang sangat kompleks, bahkan mampu menempati posisi tiga besar secara global bersaing ketat dengan model komersial tertutup paling populer saat ini.
Hal yang paling menonjol dari model ini adalah ketahanannya dalam bekerja secara mandiri tanpa henti untuk menyelesaikan proyek teknis yang membutuhkan durasi panjang.
GLM-5.1 mampu melakukan ribuan iterasi strategi secara otomatis hingga menemukan solusi terbaik bagi para pengembang. Berikut adalah beberapa detail menarik dari peluncuran ini:
Amazon Web Services (AWS) resmi berkolaborasi dengan Anthropic melalui Project Glasswing untuk menghadirkan solusi keamanan siber berbasis kecerdasan buatan yang lebih proaktif.
Kerja sama ini memanfaatkan model Claude Mythos Preview, sebuah teknologi frontier terbaru yang dirancang khusus untuk membantu tim keamanan mendeteksi sekaligus memperbaiki kerentanan dalam kode perangkat lunak sebelum ancaman sempat muncul di permukaan.
Integrasi ini memungkinkan para pengembang di ekosistem AWS untuk melakukan pemindaian infrastruktur digital secara otomatis dengan tingkat akurasi yang melampaui metode konvensional. Berikut adalah beberapa hal menarik terkait inisiatif Project Glasswing ini:
Artificial Intelligence
Artificial Intelligence
Artificial Intelligence
Artificial Intelligence
Artificial IntelligenceAnthropic meluncurkan inisiatif mendesak bernama Project Glasswing yang bertujuan untuk mengamankan perangkat lunak paling kritis di dunia menggunakan kecerdasan buatan.
Proyek ini ditenagai oleh model mutakhir terbaru, Claude Mythos Preview, yang dirancang khusus untuk mendeteksi kerentanan sistem dengan tingkat akurasi yang mampu melampaui kemampuan sebagian besar pakar keamanan manusia.
Langkah ini menandai babak baru dalam penggunaan AI frontier untuk memperkuat pertahanan siber secara proaktif sebelum celah keamanan dieksploitasi oleh pihak tidak bertanggung jawab. Beberapa hal menarik mengenai teknologi ini meliputi:
Telegram memperkenalkan AI Editor baru yang diklaim 100% privat, memungkinkan pengguna menulis ulang pesan dalam berbagai gaya unik seperti Tribal, Zen, Corp, Biblical, hingga Viking.
Fitur ini langsung terintegrasi di kolom chat, jadi pengguna bisa mengubah nada pesan menjadi lebih formal, santai, dramatis, atau bahkan bergaya epik hanya dalam sekali klik.
Yang menarik, Telegram juga mengisyaratkan bahwa ke depannya siapa pun bisa membuat dan membagikan style buatan sendiri.
Ini membuka peluang lahirnya gaya komunitas yang lebih kreatif, mulai dari tone lucu, roleplay, hingga format brand voice untuk kebutuhan kerja dan konten. Fitur seperti ini bisa jadi pembeda besar untuk pengalaman chat yang lebih personal.
Meta mengumumkan kerja sama baru dengan Arm untuk mengembangkan beberapa generasi CPU khusus AI dan data center.
Chip pertama hasil kolaborasi ini, Arm AGI CPU, diklaim mampu menghadirkan performa lebih dari dua kali lipat per rack dibanding platform x86, menjadikannya langkah besar untuk efisiensi infrastruktur AI skala besar.
Hal yang paling menarik, Meta juga akan membuka desain board dan rack untuk chip ini melalui Open Compute Project pada tahun ini.
Langkah tersebut bisa mempercepat adopsi ekosistem AI yang lebih terbuka, sekaligus memberi gambaran bagaimana masa depan server AI akan dibangun dengan standar yang lebih efisien dan mudah direplikasi.
Google resmi menghadirkan Lyria 3 Pro dan Lyria 3 Clip, dua model musik AI baru yang mendukung pembuatan lagu penuh serta klip musik 30 detik.
Mulai hari ini, keduanya tersedia melalui Gemini API dan pengalaman musik terbaru di Google AI Studio, membuka peluang baru bagi developer dan kreator untuk membangun workflow audio yang lebih cepat.
Yang menarik, pemisahan model full song dan short clip membuat proses produksi jadi lebih fleksibel untuk kebutuhan demo, jingle, soundtrack, hingga konten sosial. Beberapa sorotan penting:
Artificial Intelligence
Artificial Intelligence
Entertainment
Artificial Intelligence
Artificial IntelligenceCapCut memperkenalkan CapCut Video Studio di web sebagai workspace produksi berbasis canvas tanpa timeline tradisional.
Pendekatan ini membuat proses pembuatan video terasa lebih bebas, mulai dari ide cerita, storyboard, generasi scene, hingga editing akhir dalam satu kanvas tanpa batas.
Yang membuatnya menonjol adalah integrasi AI agent untuk membantu menulis alur cerita, fitur storyboard bawaan, serta dukungan model Dreamina Seedance 2.0 untuk generasi visual yang lebih sinematik. Hal menarik lainnya:
Meta memperkenalkan TRIBE v2 (Trimodal Brain Encoder), foundation model yang dirancang untuk memprediksi bagaimana otak manusia merespons hampir semua gambar dan suara.
Model ini dibangun dari lebih dari 500 jam rekaman fMRI milik 700+ partisipan, memungkinkan terciptanya “digital twin” aktivitas neural yang jauh lebih presisi.
Yang paling menarik, TRIBE v2 mampu melakukan zero-shot prediction untuk subjek, bahasa, dan tugas baru tanpa perlu pelatihan ulang khusus. Sorotan utamanya:
Mistral AI resmi memperkenalkan Voxtral TTS, model open-weight terbaru untuk text-to-speech yang menonjolkan suara natural, ekspresif, dan latensi sangat rendah.
Model ini dirancang untuk menghasilkan audio yang lebih realistis dengan emosi yang terasa hidup, sekaligus menjaga waktu respons tetap cepat sejak karakter pertama diproses.
Yang membuatnya menarik, Voxtral TTS mendukung 9 bahasa dan mampu menangkap variasi dialek dengan akurat, sehingga cocok untuk aplikasi global. Sorotan utamanya:
Suno memperkenalkan Suno v5.5 dengan fokus pada ekspresi yang lebih kaya dan hasil musik yang terasa semakin personal.
Versi terbaru ini memungkinkan pengguna memanfaatkan suara, karakter audio, dan selera musik mereka sendiri agar lagu yang dihasilkan punya identitas yang lebih kuat.
Update ini membuat proses kreasi terasa lebih dekat dengan gaya asli pembuatnya, bukan sekadar template AI biasa. Hal menarik yang menonjol:
Artificial Intelligence
Artificial Intelligence
Artificial Intelligence
Artificial Intelligence
Artificial Intelligence