Google ra mắt phiên bản Gemini 1.5 Pro và Flash trong khi OpenAI tung ra tính năng ‘giọng nói nâng cao’

Updated: 25/09/2024 at 19:50

Google đã chính thức phát hành hai phiên bản ổn định của mô hình API Gemini 1.5 dành cho các nhà phát triển, hứa hẹn mang lại hiệu suất vượt trội và giảm chi phí sản xuất ứng dụng.

Vào ngày 24 tháng 9, Google công bố ra mắt phiên bản ổn định của Gemini 1.5 Pro (gemini-1.5-pro-002) và Gemini 1.5 Flash (gemini-1.5-flash-002). So với các mô hình trước đó, Gemini 1.5 đã chứng kiến sự cải tiến rõ rệt trong các lĩnh vực như tạo mã, toán học, lý luận, và phân tích video, bên cạnh nhiều nâng cấp khác.

Mô tả mô hình Google Gemini 1.5 Flash và Pro. Nguồn: Google AI for Developers

Giảm bớt rào cản tài chính cho các nhà phát triển

Google đã giảm giá mô hình Gemini 1.5 Pro hơn 50% so với các phiên bản thử nghiệm trước đó, đồng thời tăng tốc độ giới hạn lên gấp ba lần và giảm độ trễ so với các phiên bản cũ.

Theo thông báo phát hành của Google, cả hai mô hình Gemini 1.5 đều mang lại những cải tiến đáng kể về tính thực tiễn và giảm thiểu ảo giác mô hình, đồng thời nâng cao khả năng tuân theo hướng dẫn, hiểu biết đa ngôn ngữ (102 ngôn ngữ), tạo SQL, cũng như khả năng xử lý âm thanh và tài liệu.

So sánh hiệu suất của các bản phát hành mẫu Gemini 1.5 mới và cũ. Nguồn: Google AI for Developers

Google đã giảm độ dài tóm tắt cho cả hai mô hình và khuyến nghị các nhà phát triển áp dụng các tùy chọn dựa trên trò chuyện để tăng cường khả năng tương tác của API.

Từ ngày 1 tháng 10, giá cho API Gemini 1.5 Pro sẽ được điều chỉnh, với mức giảm 64% cho token đầu vào, 52% cho token đầu ra, và 64% cho token được lưu trong bộ nhớ đệm gia tăng, cho các yêu cầu dưới 128.000 token.

“Để giúp các nhà phát triển dễ dàng hơn trong việc xây dựng với Gemini, chúng tôi sẽ tăng giới hạn mức giá trả phí cho Gemini 1.5 Flash lên 2.000 RPM và Gemini 1.5 Pro lên 1.000 RPM, so với mức 1.000 và 360 RPM trước đây.”

Google cũng đã công bố phiên bản thử nghiệm Gemini 1.5 Flash-8B, một phiên bản nhỏ hơn với số điểm chuẩn thấp hơn, nhưng vẫn bao gồm những cải tiến đáng kể về hiệu suất cho cả ứng dụng văn bản và đa phương thức.

Tất cả các phiên bản hiện đã có sẵn tại Google AI Studio và Gemini API.

OpenAI đang tung ra tính năng ‘giọng nói nâng cao’ được mong đợi từ lâu

Trong khi đó, OpenAI, đối thủ lớn nhất của Google trong lĩnh vực trí tuệ nhân tạo, đã bắt đầu triển khai tính năng “Advanced Voice” (giọng nói nâng cao) cho một số người dùng ChatGPT. Tính năng này cho phép giao tiếp với AI trở nên nhanh chóng và trực quan hơn, với năm giọng nói mới được bổ sung cho các tùy chọn hiện có.

Trong thông báo ngày 24 tháng 9 trên X, OpenAI cho biết:

“Advanced Voice sẽ được triển khai cho tất cả người dùng gói Plus và Team trong ứng dụng ChatGPT trong tuần này.”

Công ty cũng đùa rằng tính năng này có khả năng nói “Xin lỗi, tôi đến trễ” bằng hơn 50 ngôn ngữ, ám chỉ đến sự chậm trễ trong việc phát hành tính năng giọng nói, vốn đã được lên kế hoạch từ đầu năm nay.

Chế độ Advanced Voice là bản cập nhật cho phiên bản 4.0 mới nhất của ChatGPT, cho phép giao tiếp nhanh chóng và trực quan hơn với mô hình, đồng thời tích hợp nhiều cải tiến giúp tương tác giống con người hơn.

OpenAI đã giới thiệu năm giọng nói mới: Arbor, Maple, SXol, Spruce và Vale, bổ sung vào các tùy chọn giọng nói hiện có như Breeze, Juniper, Cove và Ember. Người dùng gói ChatGPT Plus và Team sẽ được cấp quyền truy cập theo từng giai đoạn vào các giọng nói này, nhằm làm cho cuộc trò chuyện trở nên tự nhiên hơn, bao gồm cả khả năng cho phép người dùng ngắt lời và chuyển chủ đề giữa chừng.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori 

Tạp chí Bitcoin

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Trong tháng 8, BNB nổi bật như một trong số ít các tiền điện tử vốn hóa lớn vẫn giữ vững phong độ bất chấp các đợt điều chỉnh của thị trường. Binance Coin vừa lập đỉnh lịch sử mới ở 899 USD, nâng lợi nhuận ba tháng lên gần... ...

Solana đã chính thức khởi động giai đoạn bỏ phiếu cho bản nâng cấp Alpenglow, một cải cách đồng thuận được kỳ vọng sẽ mang đến sự thay đổi lớn nhất trong lịch sử mạng lưới. Đề xuất, được biết đến với tên gọi chính thức SIMD-0326, hiện đang mở... ...

Ether tiếp tục phát đi những tín hiệu kỹ thuật tích cực, với nhà phân tích tiền điện tử Jelle nhấn mạnh đến “mô hình loa kèn – megaphone pattern” trên biểu đồ tuần, nhắm đến mục tiêu 10.000 đô la. Mô hình loa kèn, hay còn gọi là mô... ...

Gần đây, nhiều tin đồn đã xuất hiện xoay quanh khả năng một mùa altcoin sắp diễn ra. Hiệu suất của Ethereum đã ghi nhận mức tăng trưởng vượt bậc. Trung Quốc vừa công bố một gói kích thích kinh tế, trong khi Cục Dự trữ Liên bang Hoa Kỳ... ...

Giá Solana (SOL) hiện đang tăng lên khoảng 207 đô la tại thời điểm viết bài, đánh dấu mức tăng 8,5% trong 24 giờ qua. Mặc dù xu hướng ba tháng vẫn duy trì đà tăng, nhưng đợt tăng giá gần đây có thể sớm gặp phải ngưỡng kháng cự.... ...

Đề xuất của Tron (TRX) về việc cắt giảm một nửa phí giao dịch đã nhận được sự ủng hộ tích cực trước thời hạn bỏ phiếu vào ngày 29/8. Tính đến thời điểm viết bài, đã có 20 siêu đại diện bỏ phiếu ủng hộ đề xuất, trong khi... ...

Tối thứ Năm, Bitcoin (BTC) đã trở lại trên ngưỡng 112.000 USD, sau khi tìm thấy điểm tựa quan trọng vào đầu tuần. Đà phục hồi này phần nào được tiếp thêm động lực nhờ sự quan tâm xoay quanh Hội nghị Bitcoin Asia tại Hồng Kông. Tuy vậy, giới... ...

Giá XRP đã giảm 22% xuống còn 2,72 đô la từ mức đỉnh nhiều năm 3,66 đô la đạt được vào ngày 18/7, trước khi phục hồi về quanh mức 3 đô la hiện tại. Liệu altcoin phổ biến này đã thực sự chạm đỉnh hay vẫn còn một đợt... ...

Các quỹ Ether ETF đang thu hút sự quan tâm mạnh mẽ tại Mỹ, với lượng tiền đầu tư cao gấp hơn 10 lần so với các quỹ Bitcoin ETF trong năm ngày giao dịch vừa qua. Kể từ ngày 21 tháng 8, các quỹ ETF Ether đã ghi nhận... ...

Theo báo cáo mới nhất, tiến độ mã nguồn mở của Pi Network đã đạt 90%. Dự án đang được đẩy mạnh để phát hành mã nguồn công khai – bước đi mà cộng đồng kỳ vọng sẽ diễn ra vào tháng 9 năm 2025. Mốc tiến triển này làm... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode