Thông tin liên hệ
- 036.686.3943
- admin@nguoicodonvn2008.info
Google vừa ra mắt một ứng dụng AI mới mang tên Google AI Edge Eloquent — công cụ ghi âm và chuyển giọng nói thành văn bản có thể hoạt động hoàn toàn offline. Ứng dụng này sử dụng các mô hình Gemma của Google và hiện đã có mặt trên iPhone thông qua App Store.
Khác với các ứng dụng ghi âm truyền thống, Google AI Edge Eloquent không chỉ chuyển giọng nói thành văn bản mà còn tự động chỉnh sửa nội dung để trở nên rõ ràng, chuyên nghiệp hơn. Ứng dụng có thể loại bỏ các từ đệm như “ừm”, “à”, những đoạn nói ngập ngừng hoặc các câu sửa giữa chừng. Điều này giúp văn bản sau khi ghi âm có thể sử dụng ngay mà không cần chỉnh sửa nhiều.
Google AI Edge Eloquent được thiết kế theo hướng offline-first , nghĩa là bạn có thể tải mô hình nhận diện giọng nói về thiết bị và sử dụng mà không cần kết nối internet. Điều này giúp đảm bảo quyền riêng tư vì dữ liệu giọng nói không cần gửi lên máy chủ, đồng thời cũng giúp xử lý nhanh hơn.
Tuy nhiên, Google vẫn cung cấp thêm Cloud Mode. Khi bật chế độ này, dữ liệu sẽ được gửi đến các mô hình Gemini trên cloud để xử lý nâng cao. Cloud Mode có thể mang lại kết quả mượt hơn, đặc biệt khi xử lý câu dài hoặc nội dung phức tạp. Người dùng có thể linh hoạt chuyển đổi giữa hai chế độ tùy theo nhu cầu sử dụng.
Một điểm đáng chú ý của Google AI Edge Eloquent là khả năng xử lý nội dung sau khi ghi âm. Ứng dụng có thể biến bản ghi thành các ý chính, chỉnh sửa văn bản theo phong cách trang trọng hoặc rút gọn nội dung.
Ví dụ, bạn có thể nói một đoạn dài, sau đó yêu cầu ứng dụng chuyển thành bản tóm tắt hoặc chỉnh sửa theo văn phong chuyên nghiệp. Điều này đặc biệt hữu ích khi bạn cần ghi chú cuộc họp, soạn email hoặc tạo nội dung nhanh chóng.

Ngoài ra, ứng dụng còn cung cấp thống kê như tốc độ nói theo phút, tổng số từ và lịch sử ghi âm. Những thông tin này giúp người dùng theo dõi hiệu suất làm việc hoặc cải thiện kỹ năng thuyết trình.
Google cũng tích hợp một context dictionary để cải thiện độ chính xác khi nhận diện giọng nói. Người dùng có thể thêm thuật ngữ chuyên ngành, tên riêng hoặc import dữ liệu từ Gmail để hệ thống hiểu đúng hơn những từ thường dùng.
Bên cạnh AI Edge Eloquent, Google còn phát hành một ứng dụng khác là Google AI Edge Gallery. Ứng dụng này hoạt động như một sandbox AI, cho phép chạy trực tiếp các mô hình Gemma ngay trên thiết bị.
AI Edge Gallery hỗ trợ chat AI offline, xem quá trình suy luận của mô hình theo thời gian thực và thử nghiệm prompt. Ngoài ra, ứng dụng còn cung cấp công cụ benchmark để kiểm tra hiệu suất các mô hình AI trên phần cứng của thiết bị.

Google AI Edge Eloquent được xây dựng dựa trên dòng mô hình Gemma, bao gồm cả Gemma 4 mới được Google phát hành gần đây. Đây là dòng mô hình open-weight được thiết kế để chạy trên thiết bị cục bộ với khả năng suy luận mạnh mẽ.
Gemma 4 có các phiên bản nhỏ dành cho thiết bị di động như E2B và E4B, cùng các phiên bản lớn hơn như 26B và 31B dành cho máy tính. Các mô hình này hỗ trợ context window lên tới 128K token và thậm chí 256K ở các phiên bản lớn hơn, giúp xử lý nội dung dài hiệu quả hơn.
Google AI Edge Eloquent cho thấy Google đang đẩy mạnh xu hướng AI chạy trực tiếp trên thiết bị. Đây là hướng đi ngày càng phổ biến vì mang lại nhiều lợi ích như tăng tốc độ xử lý, cải thiện quyền riêng tư và giảm phụ thuộc vào cloud.
Trong tương lai, nhiều ứng dụng AI có thể sẽ hoạt động theo mô hình này, đặc biệt khi phần cứng thiết bị di động ngày càng mạnh hơn.
Nhìn chung, Google AI Edge Eloquent phù hợp với những người thường xuyên ghi chú bằng giọng nói, viết nội dung hoặc ghi âm cuộc họp. Khả năng hoạt động offline giúp ứng dụng đặc biệt hữu ích khi làm việc di động hoặc xử lý dữ liệu nhạy cảm.
Với việc kết hợp giữa AI chạy cục bộ và xử lý cloud khi cần, Google AI Edge Eloquent đang trở thành một trong những ứng dụng AI ghi âm đáng chú ý nhất hiện nay.
Nguồn tin: Quantrimang.com
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Cách chỉnh ảnh đồ ăn ảo diệu ngay trên Canva
Cách chỉnh ảnh đồ ăn ảo diệu ngay trên Canva
Kỹ thuật tạo ngữ cảnh cho AI Agent
Các mô hình kỹ thuật tạo ngữ cảnh trong thực tế
5 cuốn sách hay nhất giúp xây dựng Agentic AI system trong năm 2026
Google Gemini Omni: Biến mọi thứ thành video
Hướng dẫn viết phiếu đánh giá viên chức cuối năm
Cách tạo ảnh nam châm tủ lạnh cực hot với AI
Tất tần tật về MusicFX DJ: Ứng dụng AI tạo nhạc của Google
Hãy Yêu Bản Thân Hơn Khi Yêu Một Người Khác
Tôi của những năm tháng 17
Khi tuổi tác trở thành gánh nặng
Hai năm cố chấp một cuộc tình không tên
Cách tạo poster bằng AI trên Microsoft Designer
Prompt tạo ảnh biếm họa trên ChatGPT cực nhanh
Xây dựng AI agent cho doanh nghiệp của bạn
Hướng dẫn sử dụng thư viện của Copilot
Cách chèn nhạc nền AI vào video trên Google Vids
Hướng dẫn thử quần áo bằng AI trên Canva
Cách dùng công cụ viết AI trên TeraBox