AI đang dần hồi sinh trong 5, 6 năm qua
Tại sao lại sử dụng từ “hồi sinh” để nói về một công nghệ mà công chúng mới nghe trong những năm gần đây? Bởi vì từ nhiều thời đại trước đó, những ý tưởng về một cỗ máy biết suy nghĩ đã được các nhà khoa học đưa ra bàn luận rất nhiều.
Alan Turing đã thử nghiệm một sản phẩm cùng tên ông vào năm 1950 và thu hút nhiều sự chú ý. Hội thảo Dartmouth năm 1956 là một sự kiện quan trọng đánh dấu sự ra đời của AI khi John McCarthy đề xuất cụm từ “trí tuệ nhân tạo” để đại diện cho sự tăng trưởng nghiên cứu đang phát triển vào cybernetics, mạng nơron, và lý luận biểu tượng.
Alan Turing.
Trong thập niên 60 và 70, đã có những tiến bộ đáng kể trong các lĩnh vực xử lý ngôn ngữ tự nhiên, lý luận máy móc và thị giác máy móc. Với sự ra đời của các sáng kiến máy tính thế hệ thứ năm ở nhật bản trong những năm 80, đã có những tiến bộ đáng kể trong các hệ thống chuyên gia, suy luận dựa trên trường hợp, và sự hồi phục trong các mạng thần kinh có phát minh. Machine Learning (ML – Học máy) đã đạt được động lực trong những năm 90 với sự thay đổi so với các phương pháp biểu tượng trước đó và hướng tới khai thác xác suất và thống kê.
Gần đây, giữa lúc các khoản đầu tư lớn đang đổ vào các startup đầu tiên và già dặn, giới truyền thông đã không ngừng cảnh báo về một tương lai của thế hệ robot sát nhân. Những gã khổng lồ trong nền công nghiệp như IBM, Microsoft, Google và nhìn vào cách người ta say mê Siri hay Alexa, liệu có phải cuối cùng AI cũng đã có thể đến. Nhưng có thực sự vậy không?
ML hay là AI?
Phần lớn những gì chúng ta gọi là AI ngày nay là kết quả của việc ứng dụng ML đến lượng dữ liệu cực lớn. Nói chính xác hơn thì việc áp dụng Học máy đã cho phép tìm kiếm và các trợ lý kích hoạt bằng giọng nói như Siri, các công cụ nhận dạng sức khỏe như chẩn đoán và điều trị ung thư, nhận diện khuôn mặt như AWS Rekognition. Ngoài ra không thể không kể đến các lĩnh vực phân tích và nhận dạng hình ảnh và video rộng rãi hơn, công cụ dịch như Bing Translator, công cụ nhận dạng giọng nói và sự xuất hiện của ô tô tự lái, …
Về mặt kỹ thuật, chúng ta nên gọi đây là sự hồi sinh của Deep Learning (DL – Học sâu) chứ không phải là sự hồi sinh của AI.
Lịch sử của Học sâu bắt đầu từ năm 1943 với việc tạo ra mô hình máy tính McCulloch dựa trên sự hiểu biết về mạng lưới thần kinh của bộ não con người. Thuật ngữ nói trên được đặt ra vào cuối những năm 80, tuy nhiên tác động của nó chỉ thực sự diễn ra vào những năm 2000. Và với cái gọi là cuộc cách mạng Học sâu bắt đầu từ năm 2012, ngành công nghiệp điện toán đã thực sự bị phá vỡ. Vào tháng 3/2019, Yoshua Bengio, Geoffrey Hinton và Yann LeCun đã được trao giải thưởng Turing cho nghiên cứu đột phá khi họ lấy DL làm chủ đạo.
Yoshua Bengio, Geoffrey Hinton và Yann LeCun.
Nói một cách đơn giản, DL là một kỹ thuật Học máy dạy cho máy tính làm những thứ tự nhiên như với con người, tức là học từ các ví dụ. Với Học sâu, một mô hình máy tính học cách thực hiện các nhiệm vụ phân loại trực tiếp từ hình ảnh, văn bản hoặc âm thanh, … Các mô hình này được đào tạo (cả được giám sát và không được giám sát) bằng cách sử dụng một tập hợp lớn dữ liệu mô phỏng hành vi của các tế bào thần kinh của con người.
Gót chân Achilles của ML trong thời đại hiện nay
Để đào tạo một mô hình DL ngày nay, có hai kỹ thuật mà hiệu quả cuối cùng sẽ trở thành lý do cho AI.
Đầu tiên, các phương pháp học tập thông thường sử dụng một cách tiếp cận đòi hỏi dữ liệu đào tạo phải được tổng hợp tập trung trên một hệ thống duy nhất (hoặc trung tâm dữ liệu của nhà cung cấp). Google, Amazon, Microsoft, Apple và Facebook, … đã tổng hợp số lượng lớn dữ liệu người dùng và lưu trữ chúng trong hệ thống của họ. Sau đó, theo cách một lần hoặc liên tục, họ chạy các thuật toán của mình để khai thác và xây dựng các mô hình DL. Rõ ràng điều này xâm phạm quyền riêng tư. Và khi không có sự cho phép của người dùng, các hệ thống này đang khai thác dữ liệu riêng tư nhạy cảm để xây dựng các ứng dụng AI của họ.
Thứ hai, và vấn đề không kém là cách tiếp cận tập trung thường phụ thuộc vào nhà cung cấp. Ví dụ như sự lựa chọn thuật toán của nhà cung cấp, cơ chế thực hiện (ngôn ngữ, thư viện, công cụ), phần cứng ưa thích của họ (bên trong, bên ngoài, phụ thuộc vào nhà sản xuất chip, …), kiến trúc trung tâm dữ liệu của họ, nhân sự của họ (có nguy cơ bị xâm phạm, bị mua chuộc, …) và sự lựa chọn công cụ của họ để hiển thị kết quả của các thuật toán đào tạo. Theo cách nói khoa học máy tính, việc triển khai một nhà cung cấp duy nhất tuân theo vấn đề được gọi là Bài toán các vị tướng Byzantine.
Một trong những kỹ thuật này chính là một thách thức gây chết người cho các ứng dụng AI ngày nay. Chúng là gót chân Achilles của AI. Nếu ngành công nghiệp không giải quyết được chúng, thì AI sẽ hồi sinh một lần nữa.
Blockchain và ML
Các nền tảng blockchain đã dẫn đến những tiến bộ đáng kinh ngạc trong việc thiết kế và phát triển các ứng dụng và hệ thống phi tập trung. Nhờ đó mà nó đã được áp dụng cho các lĩnh vực từ tiền điện tử đến chuỗi cung ứng doanh nghiệp.
Quan trọng hơn, có hai khả năng khiến blockchain kích hoạt được sự phân quyền vốn được thêm vào cho nó.
Đầu tiên, blockchain cung cấp khả năng cho người dùng kiểm soát dữ liệu của họ, và quyết định khi nào, ở đâu, cho ai và trong bao lâu để cung cấp quyền truy cập vào dữ liệu của họ. Blockchain là luận điểm chống lại các hệ thống tự động và khai thác dữ liệu riêng tư của người dùng. Hơn nữa, với sự ra đời của Zero-knowledge proofs (bằng chứng không kiến thức), các blockchain giờ đây có khả năng không thể tiết lộ bất cứ gì về giao dịch ngoại trừ việc nó hợp lệ.
Thứ hai, blockchain được thiết kế mà không có cơ quan hoặc hệ thống trung ương. Do đó, để đạt được thỏa thuận về cả dữ liệu và giao dịch, blockchain sử dụng nhiều thuật toán về đồng thuận fault-tolerant (chịu lỗi). Mặc dù có sự phân loại thuật toán đồng thuận, nhưng tất cả chúng đều có chung đặc điểm tương tự để đạt được thỏa thuận trên một tập hợp các nút (hoặc hệ thống) phi tập trung. Cụ thể, một biến thể được gọi là Đồng thuận Byzantine giải quyết lỗi Byzantine đã đề cập ở trên. Blockchain cho phép phát triển các ứng dụng AI không phụ thuộc vào việc triển khai một nhà cung cấp với tất cả các rủi ro và lỗi đồng thời của chúng.
Kết hợp cùng với nhau, hai khả năng quan trọng này có thể cho phép triển khai chương trình ML ngày nay để giải quyết gót chân Achilles của nó. Và vì vậy, nó cho phép các ứng dụng AI không xâm phạm quyền riêng tư và không dễ bị lỗi Byzantine.
Tiếp theo sẽ là gì?
Sự kết hợp giữa blockchain và AI sẽ mở ra một cách tiếp cận mới mang tính đột phá để lấy AI làm chủ đạo. Đồng thời điều đó sẽ bảo vệ quyền riêng tư của người dùng và đảm bảo các ứng dụng trung lập với nhà cung cấp giúp giảm thiểu rủi ro.
Một lượng cực lớn dữ liệu được tạo ra bởi người dùng và thiết bị của họ trong suốt cuộc đời của họ. Dữ liệu này chứa thông tin có giá trị về người dùng và hành vi của họ, chúng trở thành nền tảng của việc xây dựng các mô hình Học sâu hiệu quả. Nhờ đó cung cấp các dịch vụ được cá nhân hóa nhằm nâng cao tối đa trải nghiệm của người dùng (ví dụ Siri). Blockchain cung cấp một giải pháp thay thế duy nhất để xây dựng các mô hình được cá nhân hóa như vậy mà không xâm phạm quyền riêng tư của người dùng.
Điều quan trọng là ngành công nghiệp tại địa chỉ lớn đặt quyền riêng tư của người dùng lên trên bất kỳ lợi ích thương mại nào. Họ sử dụng các khả năng của blockchain để xây dựng các mô hình ML cho các ứng dụng AI.
Các ứng dụng như nhận diện khuôn mặt đang được sử dụng rộng rãi (bao gồm cả các cơ quan chính phủ), các rủi ro do dương tính giả và âm tính giả xuất phát từ một loạt các vấn đề khi các mô hình ML được gắn với một nhà cung cấp duy nhất là quá nghiêm trọng để tiếp tục bỏ qua. Đặt bối cảnh lên hệ thống điện tử hàng không như máy bay Boeing và Airbus được thiết kế để trở thành Byzantine-Fault Tolerant trong nhiều thập kỷ.
Các công cụ như AWS Rekognition rồi sẽ được sử dụng bởi các dịch vụ nhập cư và các cơ quan tuần tra biên giới. Điều tối quan trọng là các cơ quan chính sách và quy định phải xem xét lại bản chất nguyên thủy của các ứng dụng AI hiện nay (liên quan đến các hệ thống điện tử hàng không).
Điều bắt buộc là chúng ta phải tránh xa các triển khai của một nhà cung cấp và các rủi ro liên quan đến việc triển khai Học sâu phi tập trung, sử dụng các tài nguyên điện toán (thuật toán, ngôn ngữ, phần cứng và cộng sự) trải rộng trên nhiều nhà cung cấp và nhà cung cấp.
Tương lai được phân cấp. Và AI cũng không ngoại lệ.
- Trung Quốc nghiên cứu Blockchain và AI cho việc tài trợ xuyên biên giới
- Trí tuệ nhân tạo (AI) và ứng dụng trong hoạt động marketing
Nguyên Bảo
Tạp chí Bitcoin | Cryptoslate