ttth247.com

Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Có một công cụ mới đứng đầu trong thế giới đánh giátrí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Source: tapchibitcoin.io

Các bài tương tự
1 tháng trước - Sau khi khép lại tuần trước trong sắc xanh trên mốc $68.000 và có thời điểm chạm ngưỡng $70.000, Bitcoin đã giảm mạnh xuống mức thấp $65.877 vào ngày 29 tháng 7 sau khi chính phủ Hoa Kỳ chuyển 2 tỷ đô la BTC bị tịch thu có liên quan đến...
1 tháng trước - Vào tháng 11/2023, công ty khởi nghiệp về trí tuệ nhân tạo xAI của tỷ phú Elon Musk chính thức phát hành mô hình AI đầu tiên mang tên Grok
2 tuần trước - Apple và nhà sản xuất chip Nvidia được cho là đang quan tâm đến việc tham gia vào vòng gọi vốn sắp tới của OpenAI, một động thái có thể định giá công ty trí tuệ nhân tạo này vượt mốc 100 tỷ USD. Đối với Apple, đây sẽ là một bước đi khá...
1 tháng trước - Elon Musk đã công bố phiên bản beta của công cụ AI Grok-2, thế hệ kế nhiệm của Grok-1.5, cho người dùng trên nền tảng X. Grok-2 bao gồm hai mô hình ngôn ngữ: Grok-2 và phiên bản “nhỏ hơn” của nó là Grok-2 mini. Grok-2: Phiên bản này tích...
1 tháng trước - Từ nhận định Bitcoin sắp hình thành breakout lớn đến việc Coinbase sẽ cho phép chuyển đổi giữa đồng euro và stablecoin được neo theo đồng euro với tỷ lệ 1-1 tại các khu vực pháp lý được hỗ trợ, sau đây là một số tin tức nổi bật trên thị...
Xem tin bài khác
31 phút trước - Một thẩm phán liên bang tại Texas đã bác bỏ vụ kiện mà công ty phát triển blockchain Consensys đệ đơn chống lại Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) cùng năm Ủy viên, bao gồm Chủ tịch Gary Gensler. Vụ kiện, được nộp vào tháng 4,...
31 phút trước - Các token liên quan đến trí tuệ nhân tạo (AI) đã tăng mạnh trong tuần qua, ghi nhận mức tăng hai chữ số khi thị trường tiếp thu thông tin về việc Cục Dự trữ Liên bang Mỹ cắt giảm lãi suất 50 điểm cơ bản. Artificial Superintelligence...
31 phút trước - Một thẩm phán đã chấp thuận cho Terraform Labs ngừng hoạt động theo một phần trong kế hoạch phá sản của công ty tại Hoa Kỳ. Theo báo cáo ngày 19 tháng 9 từ Reuters, Thẩm phán Brendan Shannon của Tòa án Phá sản Hoa Kỳ tại Quận Delaware đã...
1 giờ trước - Các token theo chủ đề trí tuệ nhân tạo đã tăng vọt trong 24 giờ qua, đạt mức tăng hai chữ số khi thị trường đón nhận động thái cắt giảm lãi suất 50 điểm cơ bản của Cục Dự trữ Liên bang Hoa Kỳ. Artificial Superintelligence Alliance...
1 giờ trước - Bitcoin (BTC) đã tăng lên trên 62.000 USD vào ngày 19 tháng 9, tăng cao hơn giá thực tế của người nắm giữ ngắn hạn (STH) và cho thấy tiềm năng tăng giá hơn nữa, theo dữ liệu trên chuỗi. Giá thực tế của STH là một số liệu tính toán giá...