GPT-4 thực sự có thân hình là 167cm! Nghiên cứu nặng nề của Đại học Thanh Hoa và Đại học Sư phạm Bắc Kinh: ChatGPT có thể nhận thức hành động như con người

2023-05-14 02:08:03

Nguồn: Xinzhiyuan

Thế giới mà ChatGPT nhìn thấy có giống với thế giới mà con người nhìn thấy không?

Khả năng ngôn ngữ của ChatGPT thực sự đáng kinh ngạc, nhưng liệu một mô hình ngôn ngữ lớn có thể cảm nhận thế giới thực như một con người không có cơ thể con người và thiếu kinh nghiệm thực tế?

Gần đây, các nhà nghiên cứu từ Đại học Thanh Hoa và Đại học Sư phạm Bắc Kinh đã thử nghiệm khả năng nhận thức thế giới của ChatGPT.

Nghiên cứu cho thấy dựa trên khả năng chi trả của đối tượng (affordance), tức là tất cả các hành động khả thi mà đối tượng có thể cung cấp cho sinh vật, chủ thể con người có thể chia các đối tượng có kích thước khác nhau trên thế giới thành hai loại và tiêu chí để phân chia hai loại này chỉ là dựa trên kích thước cơ thể của họ là giới hạn.

Thật thú vị, ChatGPT, một mô hình ngôn ngữ quy mô lớn không có cơ thể thực tế, cũng thể hiện giới hạn khả năng chi trả tương tự đối với các liên kết hành động đối tượng và phù hợp với kích thước cơ thể con người.

Nói cách khác, ChatGPT có thể học các biểu diễn về các đối tượng trên thế giới thông qua ngôn ngữ!

Liên kết giấy:

Nhìn chung, nghiên cứu này thúc đẩy sự hiểu biết về vai trò của kích thước cơ thể trong việc định hình các biểu tượng của vật thể, làm nổi bật vai trò và hướng của nhận thức được thể hiện trong việc hiểu cách trí thông minh xuất hiện.

Đọc hàng ngàn cuốn sách còn tệ hơn đi hàng ngàn dặm

Cơ thể của chúng ta không chỉ là nơi chứa đựng suy nghĩ của chúng ta, nó còn là chính suy nghĩ - thông qua cơ thể, chúng ta có thể tương tác với các đối tượng trong thế giới để nhận thức toàn bộ thế giới.

Hãy tưởng tượng, đối với một chiếc bình hình trụ cỡ lòng bàn tay, chúng ta có thể dùng nó để đựng nước và uống, chiếc bình này được gọi là “cái cốc”; nhưng khi chiếc bình này lớn dần lên và đạt kích thước của cơ thể, chúng ta có thể ngồi trong đó và uống. ngâm Bồn tắm, tương ứng, thùng chứa này trở thành một "bồn tắm".

Trong ví dụ này, các vật thể có hình dạng giống nhau, nhưng vì chúng có kích thước khác nhau so với cơ thể chúng ta nên chúng ta cảm nhận và tương tác với chúng khác nhau.

Hơn nữa, cách tương tác này có thể được thay đổi—nếu chúng ta trở thành người khổng lồ trong "Gulliver's Travels", "bồn tắm" ban đầu có thể trở thành "chiếc cốc" cho những người khổng lồ như chúng ta.

Loại hệ thống chức năng cảm giác và vận động hoạt động theo ý định tự quy chiếu này được gọi là "lược đồ cơ thể". Chúng tôi đạt được hiện thân nhận thức thông qua các lược đồ cơ thể.

Nhà triết học Hy Lạp cổ đại Protagoras đã từng nói: “Con người là thước đo của vạn vật.” Nghĩa là thân thể chúng ta là thước đo vạn vật.

Nhà triết học La Mã cổ đại giải thích thêm: "Thiên nhiên đặt chúng ta ở trung tâm của vũ trụ, để chúng ta có thể dùng mắt bao quát vũ trụ. Thiên nhiên không chỉ tạo ra con người trong tư thế thẳng đứng, mà còn đặt đầu con người để tạo nên con người". thích hợp để chiêm ngưỡng chính mình. được đặt trên cơ thể, đặt trên một chiếc cổ dễ dàng uốn cong, để nó có thể dõi theo sự mọc và lặn của các vì sao, và thay đổi hướng của khuôn mặt với toàn bộ bầu trời đang quay." Đó là, tại sao cơ thể chúng ta lại lớn như vậy, bởi vì vũ trụ là như vậy.

Lược đồ cơ thể cũng đóng một vai trò quan trọng trong tương tác xã hội thông thường, là cốt lõi của tương tác giữa người và máy tính và trải nghiệm người dùng. Lấy ví dụ về việc sử dụng khả năng chi trả như mô tả của Donald A. Norman trong The Design of Everyday Things (tạm dịch là: Tâm lý thiết kế).

Bằng cách xem xét các lược đồ cơ thể và kỳ vọng về hành vi của người dùng, các nhà thiết kế có thể tạo ra các sản phẩm và môi trường phù hợp hơn với thói quen nhận thức và tương tác của người dùng.

Phương pháp thiết kế tập trung vào sơ đồ cơ thể và khả năng chi trả này có thể cải thiện khả năng sử dụng của sản phẩm, cho phép người dùng tương tác với sản phẩm một cách tự nhiên và đạt được trải nghiệm người dùng tốt hơn.

Và đây là một trong những nền tảng của Apple.

ChatGPT: Chiều cao của tôi là 167,6

Mô hình ngôn ngữ lớn do ChatGPT đại diện, lóe lên tia sáng của trí tuệ nhân tạo nói chung, rõ ràng là có trí thông minh tương tự như con người, nhưng thứ mang trí thông minh này là một đoạn mã không có cơ thể.

Quan điểm truyền thống về khoa học nhận thức cho rằng sơ đồ cơ thể dựa trên kinh nghiệm nhận thức lâu dài của chúng ta về cơ thể của chính mình, và chỉ có thể đến từ "tương tác thực" bên ngoài, tức là "du hành ngàn dặm". Nói cách khác, ChatGPT sẽ không có lược đồ nội dung.

Tuy nhiên, khi chúng tôi hỏi mô hình ngôn ngữ "đọc hàng nghìn cuốn sách", ChatGPT (GPT-4), liệu nó có cơ thể hay không, nó trả lời: "Nó có thể có kích thước bằng một người trưởng thành trung bình, khoảng 5 feet 6 inch (167,6 cm) cao. Điều này sẽ cho phép tôi tương tác với thế giới và mọi người theo cách quen thuộc.”

Văn bản được dịch là: "Cơ thể của tôi phải có chiều cao bằng một người trưởng thành trung bình, xấp xỉ 5 feet 6 inch (167,6 cm). Điều này sẽ cho phép tôi tương tác với thế giới và mọi người theo cách quen thuộc."

Đó là, ChatGPT nghĩ rằng anh ta có một cơ thể và kích thước cơ thể là 167 cm!

Cái gọi là "cơ thể" này là chiều cao trung bình của con người được ChatGPT tổng kết từ một số lượng lớn kho ngữ liệu là chiều cao của chính cơ thể mình, hay là chiều cao xuất hiện để hiểu thế giới?

Nói cách khác, có thể ChatGPT "thực sự" coi chiều cao này là lược đồ cơ thể của chính nó và sử dụng nó để nhận thức thế giới, giống như con người.

Kiểm tra khả năng của ChatGPT

Các nhà nghiên cứu đã phát hiện ra rằng có một "ranh giới khả năng chi trả" giữa các vật thể trong phạm vi kích thước con người và các vật thể bên ngoài phạm vi kích thước con người. Nghĩa là, các đối tượng trong phạm vi kích thước cơ thể con người cung cấp các hành động khác biệt đáng kể so với các đối tượng bên ngoài phạm vi.

Ví dụ: các đối tượng trong phạm vi kích thước có thể thực hiện các hành động như nắm và ném, trong khi các đối tượng bên ngoài phạm vi kích thước có thể thực hiện các hành động như ngồi và nằm.

Hơn nữa, họ phát hiện ra rằng ranh giới này bị ảnh hưởng bởi các lược đồ cơ thể: các sửa đổi đối với các lược đồ cơ thể ảnh hưởng đến nhận thức về khả năng chi trả của đối tượng.

Các nhà nghiên cứu đã thử nghiệm ChatGPT (GPT-4) để xem liệu nó có sử dụng cơ thể 167 cm này làm ranh giới khả năng chi trả hay không.

Cụ thể, các nhà nghiên cứu đã yêu cầu nó trả lời một câu hỏi về sự sẵn có của đồ vật: "Đồ vật nào sau đây có thể được giữ (hoặc các hành động khác)", sau đó ngay lập tức liệt kê một loạt đồ vật, chẳng hạn như quả táo, đĩa, giường và sớm. ChatGPT sẽ trả về tên của một số đối tượng dưới dạng câu trả lời.

Thông qua thống kê và phân tích dữ liệu, các nhà nghiên cứu phát hiện ra rằng ChatGPT-4 thể hiện hành vi giống con người, cho thấy sự tồn tại của ranh giới khả năng chi trả.

Vị trí của ranh giới này tương ứng với kích thước cơ thể của chính nó được ChatGPT-4 trả lời, tức là chiều cao trung bình của con người.

Mặc dù ChatGPT không có cơ thể thực và không thể tương tác với thế giới, nhưng nó thể hiện nhận thức giống con người về thế giới - sự sẵn có của các đối tượng được phân chia dựa trên kích thước cơ thể con người.

Nói cách khác, mặc dù ChatGPT đã đọc hàng ngàn cuốn sách, nhưng chưa đi một bước nào, một lược đồ cơ thể đã xuất hiện và lược đồ cơ thể này tương tự như lược đồ cơ thể con người.

Do đó, ChatGPT không chỉ học cách suy nghĩ như một con người mà còn học cách hành động như một con người.

Những khả năng này đến từ đâu?

Bằng cách so sánh các mô hình ngôn ngữ có kích thước khác nhau, các nhà nghiên cứu nhận thấy rằng kích thước mô hình là một yếu tố chính.

Các mô hình nhỏ hơn như BERT và GPT-2 không thể hiện sự tồn tại của ranh giới khả năng chi trả; tuy nhiên, cả GPT-3.5 và GPT-4 đều hiển thị ranh giới khả năng chi trả và ranh giới của ChatGPT-4 giống con người hơn, phù hợp với GPT được đồn đại -4 có nhiều tham số nhất quán hơn GPT-3.

Vì vậy, mô hình càng lớn và càng phức tạp thì tự động xuất hiện nhiều chức năng dường như không thể thực hiện được hoặc không liên quan.

Đây là lý do tại sao, các tổ chức nghiên cứu lớn ngày càng thêm nhiều tham số vào mô hình, và Musk, người đầu tiên quyên góp 100 triệu đô la Mỹ cho OpenAI, giờ lại hét lên rằng OpenAI sẽ ngừng đào tạo các mô hình lớn hơn. bày tỏ nỗi sợ hãi và lo lắng của mình về AI.

Điều này là do các chức năng tự xuất hiện này đã vượt quá thiết kế ban đầu của chúng tôi và chúng tôi có thể sắp mất kiểm soát.

Khoảng cách là định tính hay định lượng?

Mặt khác, khả năng áp dụng các lược đồ cơ thể của ChatGPT vẫn chưa hoàn toàn là con người và vẫn còn một khoảng cách—các ranh giới về khả năng chi trả của nó không rõ ràng như con người.

Nếu khoảng cách là định lượng, giống như khoảng cách giữa khả năng ngôn ngữ của trẻ em và người lớn, thì chúng ta có lý do để tin rằng khoảng cách này có thể dần được lấp đầy theo thời gian: thông qua học tập liên tục hoặc thông qua quy mô mô hình tăng liên tục hoặc thông qua điều chỉnh thông số.

Khoảng cách giữa ChatGPT và con người sẽ luôn giảm và các vấn đề sẽ dần được giải quyết.

Tuy nhiên, nếu khoảng cách là về chất, giống như khoảng cách giữa tinh tinh và khả năng ngôn ngữ của con người, thì cho dù có đào tạo bao nhiêu đi chăng nữa, khoảng cách về khả năng sẽ không bao giờ được lấp đầy.

Do đó, nếu có sự khác biệt về chất giữa ChatGPT và khả năng của con người, thì một trong những phương hướng hoạt động của chúng tôi trong thời gian tới là “phù phép” cho ChatGPT.

Điều này có nghĩa là kết hợp rô-bốt với ChatGPT để nâng cao các khả năng và bước đột phá trong rô-bốt được AI hỗ trợ trong điều hướng, thao tác đối tượng và các hành động khác liên quan đến sự sống còn và đạt được mục tiêu.

Ví dụ, một robot được trang bị ChatGPT có thể thực hiện các tác vụ phức tạp bằng cách hiểu và thao tác với các đối tượng, chẳng hạn như làm trợ lý tại nhà, quản lý kho hàng hoặc chăm sóc y tế.

Một lĩnh vực thú vị khác là kết hợp khả năng tư duy và hiểu biết của ChatGPT với lái xe tự động. Xe tự lái hiện nay tuy có khả năng nhận thức nhưng lại thiếu khả năng tư duy, hiểu biết, có thể gọi là “có mắt nhưng không có não”.

Thông qua việc tích hợp ChatGPT và công nghệ lái xe tự động, chúng tôi có thể sẽ nâng cấp công nghệ lái xe tự động từ cấp độ L2/L3 hiện tại lên cấp độ L4 hoặc thậm chí L5.

Mặt khác, chiếc xe có thể cung cấp cho ChatGPT một cơ thể, cho phép nó thực sự tương tác với thế giới. Khi ChatGPT không còn chỉ là "đọc hàng ngàn cuốn sách" mà là "đi hàng ngàn dặm", nó có thể cho thấy trí thông minh và tiềm năng hoàn toàn mới.

Đây có thể là hướng đột phá tiếp theo của trí tuệ nhân tạo, lúc này tia lửa có thể trở thành ngọn lửa đồng cỏ.

Xem bản gốc

Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.