Get In Touch
386/21B Le Van Sy, Ward 14, District 3
Ho Chi Minh City,
quan.tram@techhunt.vn
Work Inquiries
quan.tram@techhunt.vn

OpenAI ra mắt GPT-4o và tính năng giao tiếp bằng giọng nói

OpenAI ra mắt GPT-4o và tính năng giao tiếp bằng giọng nói

Vừa qua, OpenAI đã ra mắt bản cập nhật mới cho Chat GPT với GPT-4o, là mô hình trí tuệ nhân tạo được sử dụng nhiều nhất của hãng. Và bản cập nhật 4o với chữ o đại diện cho Omni model – tích hợp toàn bộ các công nghệ và xử lý nhiều loại data khác nhau như văn bản, hình ảnh, giọng nói… là một bản cập nhật đột phá nhất trong 5 năm trở lại đây. Hãy cùng điểm qua những nâng cấp bá đạo và sáng giá nhất của GPT-4o nhé:

Tốc độ: Để làm cho AI tiên tiến trở nên dễ tiếp cận và hữu ích hơn trên toàn thế giới, khả năng ngôn ngữ của GPT-4o được cải thiện về cả chất lượng và tốc độ. ChatGPT cũng hiện hỗ trợ hơn 50 ngôn ngữ trên các cài đặt đăng ký và đăng nhập, cài đặt người dùng và nhiều hơn nữa.

Bản Free có nâng cấp: Ngoài ra, người dùng bản Free cũng sẽ có những đặc quyền mới từ bản Plus, như truy cập được cả 4o thay vì chỉ bản 3.5 như trước, và được truy cập vào kho app GPT Store với 3 triệu chatbot có sẵn.

Với tính năng Memory, GPT giờ có một “ký ức” cho riêng nó, và nó sẽ nhớ những gì bạn từng trao đổi với nó để đưa ra những câu trả lời hay gợi ý chính xác, liên quan cá nhân hóa đến bạn hơn.

Tiếp theo, chúng ta sẽ khám phá đến 2 tính năng bá đạo nhất của GPT-4o:

1/ Chữ o: giờ đây ChatGPT có thể phân tích được không chỉ đoạn văn bản text, mà nó còn hiểu và phân tích được về hình ảnh, file pdf, hay âm thanh, hay thậm chí phân tích được website bạn đang xem, và nhìn thấy những gì đang ở trên màn hình, hay nhìn thấy thế giới xung quanh qua camera!

Nhờ vậy, bạn có thể dùng nó để phân tích dữ liệu và biểu đồ, tóm tắt file pdf hay đoạn ghi âm, hỏi thông tin về hình ảnh như vật thể trong ảnh, lượng calories trong món ăn trong hình, hay thậm chí nhờ nó sửa lỗi đoạn code đang ở trên màn hình, hay phân tích về không gian xung quanh bạn.

2/ Tính năng sáng giá nhất và đưa ChatGPT gần với việc trở thành một trợ lý ảo thật sự như Jarvis của Iron man, đó là tính năng giao tiếp bằng giọng nói tức thời.

Tức thời ở đây nghĩa là, nhờ tốc độ phân tích và xử lý AI nhanh chóng mặt, cùng khả năng quan sát qua camera, quan sát màn hình, GPT-4o có thể thực sự trò chuyện với người dùng như một con người thực sự, chứ không giống như máy móc khô khan nữa. GPT-4o có thể hiểu được hơn 50 ngôn ngữ và tự dịch để trả lời cho bạn, và tốc độ trả lời ngay tức thì như một đoạn hội thoại tự nhiên, cùng với 1 giọng nói tự nhiên (được lấy cảm hứng từ diễn viên Scarlett Johanson trong phim Her.

Đáng sợ hơn, GPT-4o còn có thể “đọc” được sắc thái cảm xúc của người dùng qua giọng nói, sắc mặt và đưa ra phản hồi phù hợp. Trong buổi ra mắt demo, GPT-4o đã làm người theo dõi sửng sót khi trò chuyện với những sắc thái, câu bông đùa và sự thông minh, hiểu rõ người đang nói chuyện như một con người thực sự.

Trong tương lai, tính năng trò chuyện sẽ được ngày càng cải tiến mạnh mẽ hơn, biến GPT thành một người đồng hành thực sự hữu ích. Ví dụ, bạn có thể cho ChatGPT xem một trận đấu thể thao trực tiếp và yêu cầu giải thích luật chơi cho bạn hoặc giúp bạn giải nghĩa tất cả những vấn đề trong cuộc sống.

Nguồn: TheVerge 

    Author avatar
    Techhunt team

    Post a comment

    Your email address will not be published. Required fields are marked *