Thế giới
Microsoft tăng tốc cuộc đua AI đa phương tiện
QNgTV- Microsoft đẩy mạnh phát triển trí tuệ nhân tạo đa phương tiện. Bộ phận Microsoft AI vừa ra mắt 3 mô hình mới có khả năng tạo văn bản, âm thanh và hình ảnh.
Mô hình Transcribe-1 chuyển giọng nói thành văn bản. Hỗ trợ hơn 25 ngôn ngữ, với tốc độ xử lý nhanh gấp 2,5 lần dịch vụ Azure Accelerate. Mô hình duy trì độ chính xác trong nhiều điều kiện âm thanh.
Mô hình Voice-1 chuyển văn bản thành giọng nói. Có thể tạo 60 giây âm thanh trong 1 giây. Hỗ trợ tùy chỉnh giọng nói, khả năng mô phỏng ngữ điệu và cảm xúc gần với con người. Mô hình Image-2 tạo hình ảnh và video từ văn bản. Cho phép tạo nội dung chất lượng cao. Độ tương thích giữa hình ảnh và câu lệnh được cải thiện. Phù hợp cho thiết kế và sáng tạo nội dung.
Việc ra mắt bộ 3 mô hình cho thấy Microsoft tăng tốc xây dựng hệ sinh thái AI. Mục tiêu là cạnh tranh với các phòng thí nghiệm AI toàn cầu.

Ý kiến ()