ttth247.com

Google ra mắt phiên bản Gemini 1.5 Pro và Flash trong khi OpenAI tung ra tính năng ‘giọng nói nâng cao’

Google đã chính thức phát hành hai phiên bản ổn định của mô hình API Gemini 1.5 dành cho các nhà phát triển, hứa hẹn mang lại hiệu suất vượt trội và giảm chi phí sản xuất ứng dụng.

Vào ngày 24 tháng 9, Google công bố ra mắt phiên bản ổn định của Gemini 1.5 Pro (gemini-1.5-pro-002) và Gemini 1.5 Flash (gemini-1.5-flash-002). So với các mô hình trước đó, Gemini 1.5 đã chứng kiến sự cải tiến rõ rệt trong các lĩnh vực như tạo mã, toán học, lý luận, và phân tích video, bên cạnh nhiều nâng cấp khác.

Mô tả mô hình Google Gemini 1.5 Flash và Pro. Nguồn: Google AI for Developers

Giảm bớt rào cản tài chính cho các nhà phát triển

Google đã giảm giá mô hình Gemini 1.5 Pro hơn 50% so với các phiên bản thử nghiệm trước đó, đồng thời tăng tốc độ giới hạn lên gấp ba lần và giảm độ trễ so với các phiên bản cũ.

Theo thông báo phát hành của Google, cả hai mô hình Gemini 1.5 đều mang lại những cải tiến đáng kể về tính thực tiễn và giảm thiểu ảo giác mô hình, đồng thời nâng cao khả năng tuân theo hướng dẫn, hiểu biết đa ngôn ngữ (102 ngôn ngữ), tạo SQL, cũng như khả năng xử lý âm thanh và tài liệu.

So sánh hiệu suất của các bản phát hành mẫu Gemini 1.5 mới và cũ. Nguồn: Google AI for Developers

Google đã giảm độ dài tóm tắt cho cả hai mô hình và khuyến nghị các nhà phát triển áp dụng các tùy chọn dựa trên trò chuyện để tăng cường khả năng tương tác của API.

Từ ngày 1 tháng 10, giá cho API Gemini 1.5 Pro sẽ được điều chỉnh, với mức giảm 64% cho token đầu vào, 52% cho token đầu ra, và 64% cho token được lưu trong bộ nhớ đệm gia tăng, cho các yêu cầu dưới 128.000 token.

“Để giúp các nhà phát triển dễ dàng hơn trong việc xây dựng với Gemini, chúng tôi sẽ tăng giới hạn mức giá trả phí cho Gemini 1.5 Flash lên 2.000 RPM và Gemini 1.5 Pro lên 1.000 RPM, so với mức 1.000 và 360 RPM trước đây.”

Google cũng đã công bố phiên bản thử nghiệm Gemini 1.5 Flash-8B, một phiên bản nhỏ hơn với số điểm chuẩn thấp hơn, nhưng vẫn bao gồm những cải tiến đáng kể về hiệu suất cho cả ứng dụng văn bản và đa phương thức.

Tất cả các phiên bản hiện đã có sẵn tại Google AI Studio và Gemini API.

Trong khi đó, OpenAI, đối thủ lớn nhất của Google trong lĩnh vực trí tuệ nhân tạo, đã bắt đầu triển khai tính năng “Advanced Voice” (giọng nói nâng cao) cho một số người dùng ChatGPT. Tính năng này cho phép giao tiếp với AI trở nên nhanh chóng và trực quan hơn, với năm giọng nói mới được bổ sung cho các tùy chọn hiện có.

Trong thông báo ngày 24 tháng 9 trên X, OpenAI cho biết:

“Advanced Voice sẽ được triển khai cho tất cả người dùng gói Plus và Team trong ứng dụng ChatGPT trong tuần này.”

Công ty cũng đùa rằng tính năng này có khả năng nói “Xin lỗi, tôi đến trễ” bằng hơn 50 ngôn ngữ, ám chỉ đến sự chậm trễ trong việc phát hành tính năng giọng nói, vốn đã được lên kế hoạch từ đầu năm nay.

Chế độ Advanced Voice là bản cập nhật cho phiên bản 4.0 mới nhất của ChatGPT, cho phép giao tiếp nhanh chóng và trực quan hơn với mô hình, đồng thời tích hợp nhiều cải tiến giúp tương tác giống con người hơn.

OpenAI đã giới thiệu năm giọng nói mới: Arbor, Maple, SXol, Spruce và Vale, bổ sung vào các tùy chọn giọng nói hiện có như Breeze, Juniper, Cove và Ember. Người dùng gói ChatGPT Plus và Team sẽ được cấp quyền truy cập theo từng giai đoạn vào các giọng nói này, nhằm làm cho cuộc trò chuyện trở nên tự nhiên hơn, bao gồm cả khả năng cho phép người dùng ngắt lời và chuyển chủ đề giữa chừng.

Source: tapchibitcoin.io

Các bài tương tự
2 tuần trước - Trong tuần qua, Bitcoin đã ghi nhận mức tăng khoảng 4,4%, nhảy vọt từ dưới $63.000 lên $66.000 và chạm đỉnh cục bộ quanh $66.498, mức cao nhất trong 2 tháng qua. Biểu đồ giá BTC – 1 ngày | Nguồn: TradingView Hãy cùng Tạp Chí Bitcoin điểm...
2 tuần trước - Từ nhận định Bitcoin đã sẵn sàng để bắt đầu đợt tăng giá mới đến Ripple nhận được sự chấp thuận quy định từ Cơ quan dịch vụ tài chính Dubai (DFSA). Sau đây là một số tin tức nổi bật trên thị trường crypto. Tin tức Bitcoin Một chiến lược...
2 tuần trước - Bitcoin (BTC) đã giảm 4% vào sáng ngày 1 tháng 10, quay lại mức hỗ trợ $63.000 và xóa sạch đà tăng tích lũy trong năm ngày trước đó. Nỗ lực vượt qua ngưỡng $66.000 gần đây kéo dài chưa đến ba ngày, nhưng đợt điều chỉnh chỉ khiến dưới $40...
3 tuần trước - Đây là một tuần đầy tích cực cho AI mã nguồn mở. Vào thứ Tư, Meta công bố bản nâng cấp cho mô hình ngôn ngữ lớn hàng đầu của mình, Llama 3.2. Không chỉ có khả năng đàm thoại, Llama 3.2 còn có thể “nhìn thấy”. Điều đặc biệt hơn là một số...
1 tháng trước - Từ nhận định Bitcoin có thể quay về $55.000 trước khi tăng vọt lên đỉnh mới đến USDC mở rộng sang SUI. Sau đây là một số tin tức nổi bật trên thị trường crypto. Tin tức Bitcoin Một chiến lược gia crypto đang tiết lộ hai kịch bản mà BTC có...
Xem tin bài khác
31 phút trước - The Open Network (TON) có thể là chìa khóa để mở ra cơ hội áp dụng rộng rãi tiền điện tử và công nghệ phi tập trung. Sự lan truyền của blockchain TON phần lớn là nhờ vào mối quan hệ của nó với ứng dụng nhắn tin Telegram và hơn 950 triệu...
31 phút trước - Hành vi của những người đặt cược hàng đầu tại Polymarket đã làm dấy lên mối lo ngại về khả năng thao túng độ chính xác của thị trường dự đoán phi tập trung. Tỷ lệ cược ngày càng tăng của cựu Tổng thống Donald Trump trong cuộc bầu cử tổng...
1 giờ trước - Bitcoin đang phải đối mặt với mức đóng tuần khó khăn khi phe bò tìm cách phá vỡ xu hướng giảm kéo dài 7 tháng. Biểu đồ giá BTC 4 giờ | Nguồn: TradingView Giá Bitcoin cuối cùng cũng hé lộ breakout quan trọng Dữ liệu từ TradingView cho thấy...
2 giờ trước - Tỷ lệ khối lượng giao dịch hợp đồng tương lai trên sàn giao dịch phi tập trung (DEX) so với sàn giao dịch tập trung (CEX) đã giảm xuống còn 3,26% vào tháng 9, so với mức đỉnh điểm là 5,18% vào tháng 2. Chỉ số này thể hiện tỷ lệ khối lượng...
2 giờ trước - Hành vi của những người đặt cược hàng đầu tại Polymarket đã dấy lên mối lo ngại về khả năng thao túng độ chính xác của thị trường dự đoán phi tập trung. Tỷ lệ cược ngày càng tăng của cựu Tổng thống Donald Trump trong cuộc bầu cử tổng...