Câu chuyện về cái tên của mô hình trí tuệ nhân tạo Gemini của Google

Lần đầu tiên Gemini được nhắc đến tại sự kiện I/O năm 2023, khi Google giới thiệu sơ lược về mô hình đa phương thức đầu tiên được đào tạo nội bộ và đã cho thấy những khả năng ấn tượng. Một năm sau, các mô hình Gemini đã được tích hợp vào Tìm kiếm, Quảng cáo, Workspace, Pixel và nhiều sản phẩm khác, bao gồm cả một số cải tiến lớn nhất được chia sẻ trên sân khấu I/O 2024 ngày hôm qua. Dưới đây là câu chuyện mà các nhân viên của Google kể lại về cái tên “Gemini”
Cùng với sự phát triển của Gemini, chúng tôi tự hỏi, cái tên này bắt nguồn từ đâu? Để tìm hiểu, chúng tôi đã yêu cầu nhóm Google DeepMind chia sẻ câu chuyện về lý do tại sao họ đặt tên nó là “Gemini”.
Câu chuyện đằng sau cái tên
Ban đầu, tên dự kiến cho dự án là “Titan”, tên của vệ tinh lớn nhất của Sao Thổ. “Tôi không thực sự thích cái tên đó,” Jeff Dean, đồng trưởng nhóm kỹ thuật của Gemini cho biết. Nhưng nó đã gợi ý cho ông một ý tưởng - có lẽ là một dấu hiệu - cho một cái tên gắn liền với vũ trụ.
Gemini trong tiếng Latinh có nghĩa là “sinh đôi”. Trong thiên văn học, đây là tên của một chòm sao gắn liền với cặp song sinh trong thần thoại Hy Lạp là Castor và Pollux, tên của hai ngôi sao sáng nhất của nó. Theo tự nhiên, ý nghĩa đằng sau cái tên của mô hình AI của chúng tôi có hai mặt.
Thứ nhất, một đặc điểm chính của cung hoàng đạo Song Tử là tính cách hai mặt, có khả năng thích nghi nhanh chóng, kết nối với nhiều người và nhìn nhận mọi thứ từ nhiều góc độ - những chủ đề rất phù hợp với những gì đang diễn ra tại Google thời điểm đó.
Trong gần một thập kỷ, DeepMind và nhóm Brain từ Google Research đã chịu trách nhiệm cho một số đột phá nghiên cứu lớn nhất thế giới về AI, bao gồm học sâu quy mô lớn, học tăng cường sâu và AlphaGo, kiến trúc Transformer nền tảng cho hầu hết các mô hình ngôn ngữ lớn (LLM) ngày nay và nhiều hơn thế nữa. Để đẩy nhanh tiến độ hơn nữa, vào tháng 4 năm 2023, các nhóm đã hợp nhất để thành lập Google DeepMind, tập hợp tài năng về AI, sức mạnh tính toán, cơ sở hạ tầng và tài nguyên của họ thành một đội duy nhất.
“Nỗ lực của Gemini ra đời vì chúng tôi muốn đưa các nhóm nghiên cứu về mô hình ngôn ngữ lại gần nhau hơn,” Jeff nói. “Tôi cảm thấy khía cạnh sinh đôi trong cái tên ‘Gemini’ rất phù hợp. Những người sinh đôi ở đây là những người trong nhóm Brain cũ và nhóm DeepMind cũ, những người bắt đầu hợp tác cùng nhau trong dự án mô hình đa phương thức đầy tham vọng này.”
Nguồn cảm hứng khác cho cái tên này cũng liên quan đến vũ trụ: chương trình Mặt Trăng sớm của NASA, Dự án Gemini, diễn ra từ năm 1965 đến năm 1968. Chương trình vũ trụ then chốt này là cầu nối giữa các nhiệm vụ Mercury, xác định con người có thể sống sót trong vũ trụ, và Apollo, đưa người đầu tiên lên Mặt Trăng. Dự án Gemini, được đặt tên theo tàu vũ trụ hai người (và trùng hợp là được tên lửa Titan phóng), được thiết kế để thử nghiệm các thiết bị và kỹ thuật để giữ các phi hành gia trong không gian trong thời gian dài trước Apollo. Nó đã đưa 10 phi hành đoàn lên vũ trụ và dẫn đến những thành tích đáng kể, chẳng hạn như chuyến đi bộ ngoài không gian đầu tiên của Hoa Kỳ và việc nối liền hai tàu vũ trụ đầu tiên trên quỹ đạo Trái Đất. Ý nghĩa của Dự án Gemini đối với thành công của chương trình Apollo đã được cả nhóm ghi nhận.
Tại một thời điểm, Jeff đề xuất cái tên “Gemini” ở một bình luận trong tài liệu mà nhóm đang làm việc và nó đã được chấp nhận. “Tôi ngay lập tức bị thuyết phục bởi cái tên này, bởi vì nỗ lực to lớn để đào tạo LLM đã đồng điệu với tinh thần phóng tên lửa,” Oriol Vinyals, đồng trưởng nhóm kỹ thuật của Gemini cho biết. “Rất phù hợp để đặt tên cho dự án tham vọng nhất mà chúng tôi từng thực hiện là Gemini.”
Một bước nhảy vọt khổng lồ cho các mô hình AI
Trên nhiều phương diện, AI có tiềm năng giải quyết một số thách thức lớn nhất của thế giới, với những đột phá quan trọng đối với nhân loại như việc hạ cánh trên mặt trăng. Các mô hình Gemini của chúng tôi là một bước tiến quan trọng và đại diện cho cách chúng tôi sẽ tiếp tục vươn tới những vì sao một cách an toàn và có trách nhiệm.
“Bây giờ câu hỏi là, sẽ có phần tiếp theo cho Gemini có tên là Apollo không?” Oriol nói thêm, nở nụ cười. Bất kể tương lai ra sao, kỷ nguyên Gemini của Google mới chỉ bắt đầu. Vào tháng 12, chúng tôi đã bắt đầu với Gemini 1.0 ở ba kích thước - Ultra, Pro và Nano. Vài tháng sau, chúng tôi giới thiệu 1.5 Pro, và ngày hôm qua, chúng tôi đã công bố một mô hình 1.5 mới, Flash.
“Các ý tưởng khác được thảo luận liên quan đến cách đặt tên cho các mô hình là sử dụng tên của các ngôi sao trong vũ trụ, vì có khá nhiều kích thước khác nhau, giống như các mô hình của chúng tôi,” Oriol nói. “Có thể nói rằng chúng tôi bị vũ trụ thu hút trong Gemini!”
Kể từ khi ra mắt vào tháng 12, chúng tôi đã mang Gemini đến với hàng tỷ người thông qua các sản phẩm của Google và hàng trăm nghìn nhà phát triển và doanh nghiệp đã xây dựng với API Gemini. “Gemini ra đời như một chương trình nghiên cứu nhằm tạo ra những mô hình có khả năng nhất trên thế giới,” Oriol nói. “Bằng cách biến nó thành tên của sản phẩm, tôi hy vọng người dùng của chúng tôi sẽ cảm nhận được sự cải tiến, sáng tạo và đổi mới liên tục mà các nhóm nghiên cứu của chúng tôi sẽ mang đến trực tiếp cho họ.”
Chúng tôi không phải là nhà chiêm tinh học, nhưng có thể nói một cách chắc chắn rằng tương lai của Gemini đang rất sáng sủa.
Nguồn: The Keyword