AI có thể viết thơ, nhưng nó gặp khó khăn với toán học

Bài toán của AI phản ánh mức độ công nghệ mới này là sự thay đổi so với công nghệ điện toán trong quá khứ.

Trong năm học vừa kết thúc gần đây, một lớp học sinh nổi bật như một câu đố. Các em chăm chỉ, tiến bộ và diễn đạt lưu loát một cách đáng kinh ngạc. Nhưng kỳ lạ thay, những học sinh này — những chatbot thông minh nhân tạo — thường gặp khó khăn với toán học.

Các chatbot như ChatGPT của Open AI có thể viết thơ, tóm tắt sách và trả lời câu hỏi, thường là với sự trôi chảy ở cấp độ con người. Các hệ thống này có thể tính toán dựa trên những gì chúng đã học, nhưng kết quả có thể thay đổi và sai. Chúng được tinh chỉnh để xác định xác suất, không thực hiện các phép tính dựa trên quy tắc. Khả năng không phải là độ chính xác , và ngôn ngữ linh hoạt hơn và dễ tha thứ hơn toán học.

Kristian Hammond, giáo sư khoa học máy tính và nhà nghiên cứu trí tuệ nhân tạo tại Đại học Northwestern, cho biết: “Các chatbot AI gặp khó khăn với toán học vì chúng không được thiết kế để làm điều đó”.

Có vẻ như các nhà khoa học máy tính thông minh nhất thế giới đã tạo ra trí thông minh nhân tạo giống một chuyên ngành nghệ thuật tự do hơn là một thiên tài số học.

Trên thực tế, đó là một sự thay đổi lớn so với quá khứ của máy tính. Kể từ khi máy tính đầu tiên xuất hiện vào những năm 1940, một định nghĩa tóm tắt hay về máy tính là “toán học trên steroid”. Máy tính là những cỗ máy tính toán không biết mệt mỏi, nhanh chóng và chính xác. Xử lý số liệu từ lâu đã là thứ mà máy tính thực sự giỏi, vượt xa hiệu suất của con người.

Theo truyền thống, máy tính được lập trình để tuân theo các quy tắc từng bước và lấy thông tin trong cơ sở dữ liệu có cấu trúc. Chúng mạnh mẽ nhưng dễ vỡ. Vì vậy, những nỗ lực trước đây về AI đã gặp phải trở ngại.

Tuy nhiên, hơn một thập kỷ trước, một cách tiếp cận khác đã đột phá và bắt đầu mang lại những lợi ích đáng kinh ngạc. Công nghệ cơ bản, được gọi là mạng lưới nơ-ron, được mô phỏng một cách lỏng lẻo theo bộ não con người.

Loại AI này không được lập trình theo các quy tắc cứng nhắc mà học bằng cách phân tích lượng lớn dữ liệu. Nó tạo ra ngôn ngữ, dựa trên tất cả thông tin đã hấp thụ, bằng cách dự đoán từ hoặc cụm từ nào có khả năng xuất hiện tiếp theo — giống như con người .

Tiến sĩ Hammond cho biết: “Công nghệ này làm được những điều tuyệt vời, nhưng không phải là tất cả mọi thứ”. “Mọi người đều muốn câu trả lời cho AI là một thứ. Điều đó thật ngu ngốc”.

Đôi khi, các chatbot AI gặp khó khăn với các bài toán số học và toán học đơn giản đòi hỏi nhiều bước để đạt được giải pháp, một số nhà đánh giá công nghệ gần đây đã ghi nhận điều này. Trình độ của AI đang được cải thiện, nhưng vẫn còn thiếu sót.

Phát biểu tại một hội thảo gần đây, Kristen DiCerbo, giám đốc học tập của Khan Academy, một tổ chức phi lợi nhuận về giáo dục đang thử nghiệm với một gia sư chatbot AI và trợ lý giảng dạy, đã giới thiệu chủ đề về độ chính xác của toán học. “Đây là một vấn đề, như nhiều người trong số các bạn đã biết”, Tiến sĩ DiCerbo nói với các nhà giáo dục.

Vài tháng trước, Khan Academy đã thực hiện một thay đổi đáng kể đối với gia sư hỗ trợ AI của mình, được gọi là Khanmigo. Nó gửi nhiều bài toán số đến một chương trình máy tính thay vì yêu cầu AI giải toán. Trong khi chờ chương trình máy tính hoàn tất, học sinh sẽ thấy dòng chữ “làm toán” trên màn hình và biểu tượng Khanmigo lắc lư đầu.

Tiến sĩ DiCerbo, người vẫn lạc quan rằng các chatbot đàm thoại sẽ đóng vai trò quan trọng trong giáo dục, cho biết: “Chúng tôi thực sự đang sử dụng các công cụ được thiết kế để tính toán”.

Trong hơn một năm, ChatGPT đã sử dụng giải pháp tương tự cho một số bài toán. Đối với các nhiệm vụ như phép chia và phép nhân số lớn, chatbot sẽ triệu tập sự trợ giúp từ chương trình máy tính.

Toán học là “một lĩnh vực nghiên cứu quan trọng đang diễn ra”, OpenAI cho biết trong một tuyên bố, và là một lĩnh vực mà các nhà khoa học của công ty đã đạt được những tiến bộ ổn định. Phiên bản GPT mới của công ty đạt được độ chính xác gần 64 phần trăm trên cơ sở dữ liệu công khai gồm hàng nghìn bài toán đòi hỏi nhận thức trực quan và lý luận toán học, công ty cho biết. Con số này tăng so với 58 phần trăm của phiên bản trước.

Các chatbot AI thường xuất sắc khi chúng tiêu thụ một lượng lớn dữ liệu đào tạo có liên quan — sách giáo khoa, bài tập và các bài kiểm tra chuẩn hóa. Hiệu ứng là các chatbot đã thấy và phân tích các câu hỏi rất giống nhau, nếu không muốn nói là giống hệt nhau, trước đây. Một phiên bản gần đây của công nghệ nền tảng ChatGPT đã đạt điểm ở mức phần trăm thứ 89 trong bài kiểm tra SAT toán dành cho học sinh trung học, công ty cho biết.

Hiệu suất thất thường của công nghệ trong toán học làm tăng thêm sức mạnh cho cuộc tranh luận sôi nổi trong cộng đồng trí tuệ nhân tạo về cách tốt nhất để tiến lên trong lĩnh vực này. Nhìn chung, có hai phe.

Một bên là những người tin rằng các mạng nơ-ron tiên tiến, được gọi là các mô hình ngôn ngữ lớn, cung cấp năng lượng cho các chatbot AI gần như là một con đường duy nhất để tiến bộ ổn định và cuối cùng là trí tuệ nhân tạo tổng quát, hay AGI, một máy tính có thể làm bất cứ điều gì mà bộ não con người có thể làm. Đó là quan điểm thống trị ở nhiều nơi tại Thung lũng Silicon.

Nhưng có những người hoài nghi đặt câu hỏi liệu việc thêm dữ liệu và sức mạnh tính toán vào các mô hình ngôn ngữ lớn có đủ không. Nổi bật trong số đó là Yann LeCun, nhà khoa học AI trưởng tại Meta.

Tiến sĩ LeCun cho biết các mô hình ngôn ngữ lớn có rất ít hiểu biết về logic và thiếu lý luận thông thường. Ông nhấn mạnh rằng điều cần thiết là một cách tiếp cận rộng hơn, mà ông gọi là “mô hình thế giới” hoặc các hệ thống có thể học cách thế giới hoạt động giống như con người. Và có thể mất khoảng một thập kỷ để đạt được điều đó.

Trong khi đó, Meta đang tích hợp phần mềm trợ lý thông minh hỗ trợ AI vào các dịch vụ truyền thông xã hội của mình bao gồm Facebook, Instagram và WhatsApp, dựa trên mô hình ngôn ngữ lớn LLaMA. Các mô hình hiện tại có thể còn nhiều thiếu sót, nhưng chúng vẫn làm được nhiều việc.

David Ferrucci là người dẫn đầu nhóm xây dựng máy tính Watson nổi tiếng của IBM, đã đánh bại những người chơi “Jeopardy!” giỏi nhất từ ​​trước đến nay vào năm 2011. Giống như hầu hết các nhà khoa học máy tính, Tiến sĩ Ferrucci thấy công nghệ AI mới nhất thực sự ấn tượng — nhưng chủ yếu là vì kỹ năng ngôn ngữ của nó, không phải vì độ chính xác của nó. Công ty khởi nghiệp của ông, Elemental Cognition, phát triển phần mềm để cải thiện việc ra quyết định kinh doanh trong các lĩnh vực như tài chính, du lịch và khám phá thuốc. Công ty sử dụng các mô hình ngôn ngữ lớn làm một thành phần, nhưng cũng có nhiều phần mềm dựa trên quy tắc hơn.

Tiến sĩ Ferrucci cho biết phần mềm có cấu trúc đó là cơ sở hạ tầng máy tính hiện đang vận hành nhiều hệ thống thiết yếu của thế giới như ngân hàng, chuỗi cung ứng và kiểm soát không lưu. Ông cho biết “Đối với nhiều thứ thực sự quan trọng, cần có độ chính xác đến đau đớn”.

Kirk Schneider, một giáo viên toán trung học ở New York, cho biết ông coi sự xâm nhập của chatbot AI vào giáo dục là điều không thể tránh khỏi. Ông cho biết các nhà quản lý trường học có thể cố gắng cấm chúng, nhưng học sinh sẽ sử dụng chúng.

Nhưng ông Schneider có một số băn khoăn. “Chúng thường ổn, nhưng thường không đủ tốt về toán học. Nó phải chính xác”, ông nói. “Nó phải đúng”.

Tuy nhiên, những lần trượt chân thỉnh thoảng đó lại trở thành cơ hội để dạy học. Thầy Schneider thường chia lớp học của mình thành các nhóm nhỏ học sinh và câu trả lời của chatbot có thể là trọng tâm của cuộc thảo luận. Hãy so sánh câu trả lời của bạn với câu trả lời của bot. Ai đúng? Mỗi người trong số các bạn đã đưa ra giải pháp của mình như thế nào?

“Nó dạy họ cách nhìn nhận mọi thứ bằng con mắt phê phán và rèn luyện tư duy phản biện”, ông nói. “Điều này cũng giống như việc hỏi một người khác — họ có thể đúng và có thể sai”.

Có vẻ như đây là bài học cuộc sống dành cho học sinh của ông, một bài học đáng ghi nhớ ngay cả khi họ đã quên định lý Pythagore: Đừng tin mọi thứ mà chương trình AI nói với bạn. Đừng tin tưởng nó quá nhiều.

>>> Tham gia đầu tư chứng khoán Hàn Quốc ngay hôm nay, tiếp cận thị trường mới tìm kiếm cơ hội đạt lợi nhuận lớn cùng chuyên gia Bucket-VN :