Nhà nghiên cứu trẻ Phạm Hy Hiếu tìm những phương pháp tiếp cận mới trong lĩnh vực trí tuệ nhân tạo.

NĂM 2018, BÀI BÁO KHOA HỌC CÔNG BỐ TẠI HỘI NGHỊ QUỐC TẾ VỀ HỌC MÁY (ICML) mà Phạm Hy Hiếu là tác giả thứ nhất tạo được sự chú ý của các nhà khoa học trong lĩnh vực trí tuệ nhân tạo. Sau hơn một năm công bố, công trình có tên "Nâng cao hiệu quả tìm kiếm dựa trên cấu trúc mạng neuron qua chia sẻ các thông số" này được hơn 400 lượt trích dẫn.

Con số này khá khiêm tốn, nếu đặt cạnh đề tài “hit” của TS Lương Minh Thắng với gần 3.000 lượt trích dẫn kể từ lần đầu tiên công bố năm 2015, song lại là dấu mốc quan trọng cả với đội ngũ các nhà khoa học về trí tuệ nhân tạo ở Google Brain, lẫn với đội ngũ nghiên cứu ở nhiều nước trên thế giới khi giảm được độ phức tạp so với ban đầu.

Gương mặt 30 Under 30 Phạm Hy Hiếu: Đi tìm cánh cửa thứ ba - ảnh 1

Nhà nghiên cứu trẻ Phạm Hy Hiếu, gương mặt 30 Under 30 Việt Nam 2020.

Bài báo của Hiếu cũng là sự tiếp nối theo nhiều nghĩa. Hiếu là tác giả thứ hai sau Lương Minh Thắng – gương mặt 30 Under 30 năm 2018 của Forbes Việt Nam trong bài báo công bố năm 2015. Kết quả nghiên cứu công bố mới đây mở ra hướng đi mới giúp tiết giảm mức độ phức tạp xuống  nhiều lần, mà kết quả đạt được gần như không thua sút so với phương pháp đầu tiên.

Báo cáo công bố ở hội nghị khoa học quốc tế về học máy này so với các hội nghị cùng nội dung ở cấp châu lục, tương tự như việc giành vé dự vòng chung kết bóng đá thế giới so với giải vô địch cấp châu lục.

Phạm Hy Hiếu, nghiên cứu sinh tiến sĩ đại học Carnegie Mellon, đến nay có 10 bài báo công bố tại các hội thảo khoa học chuyên ngành, các tạp chí chuyên ngành, với hơn 4.000 lượt trích dẫn.

Tháng 6.2016, sau khi cùng lúc nhận bằng tốt nghiệp đại học và thạc sĩ của đại học Stanford, Phạm Hy Hiếu vào làm việc ở Google Brain, nơi anh gặp lại các đàn anh ở Stanford là TS Lê Việt Quốc và TS Lương Minh Thắng. Mối quan tâm chung của các nhà nghiên cứu người Việt Nam này là tìm ra các phương pháp mới trong học máy, xử lý ngôn ngữ tự nhiên, học sâu – những nhánh chính trong lĩnh vực trí tuệ nhân tạo, trọng tâm nghiên cứu ở Goolge Brain.

TRONG NỀN KINH TẾ DỰA TRÊN TRI THỨC, DỮ LIỆU ĐÓNG VAI TRÒ CỰC KỲ QUAN TRỌNG. Thu thập dữ liệu đã khó, xử lý, phân tích, và tổng hợp các thông tin từ dữ liệu thu thập được còn khó hơn. Vì sự phức tạp và tốn kém của quá trình này, các nhà khoa học đã phát minh ra trí tuệ nhân tạo, vốn có bản chất là các chương trình máy tính được “dạy” bằng dữ liệu để từ đó tổng hợp ra những quy luật quan trọng để xử lý nhiều tác vụ một cách thông minh hơn. (Xem trang bên)

Mạng nơ ron, một dạng chương trình trí tuệ nhân tạo, được thiết kế mô phỏng theo mô hình hoạt động của não người. Về bản chất, mạng nơ ron là các hàm phức hợp giữa trọng số và dữ liệu. Khi được huấn luyện bằng dữ liệu, mạng nơ ron có thể tổng hợp các thông tin quan trọng từ các dữ liệu và lưu trữ chúng trong các trọng số. Nhờ các trọng số này, mạng nơ ron có thể xử lý được các dạng thông tin tương tự.

Google Translate có bản chất là một mạng nơ ron với hàng trăm triệu trọng số. Khi muốn dịch tự động, chẳng hạn từ tiếng Anh sang tiếng Việt, các nhà khoa học và kỹ sư của Google sẽ tiến hành “huấn luyện” mạng nơ ron này bằng cách thu thập vài trăm ngàn đến vài triệu câu song ngữ Anh – Việt (càng nhiều càng tốt), và đem cho mạng nơ ron “học” qua. Sau khi “học” xong, mạng nơ-ron này sẽ rút ra các thông tin chính từ các câu đã được học.

Các thông tin này được lưu giữ trong vài trăm triệu trọng số của mạng, và dựa trên các trọng số này, mạng sẽ dịch được các câu từ tiếng Anh sang tiếng Việt, kể cả các câu chưa được “học”. Để hình thành mạng nơ ron, các nhà khoa học cần phải thiết kế kiến trúc của mạng, bao gồm việc mạng có bao nhiêu trọng số, tương tác giữa các trọng số và dữ liệu, sử dụng các hàm phức hợp nào...

Quá trình này thường được thực hiện thủ công, nghĩa là phải thử tất cả các kiến trúc hợp lý và thí nghiệm xem kiến trúc nào mang lại hiệu quả tốt nhất. Việc này rất tốn kém và mất thời gian.

Năm 2016, Barret Zoph và TS. Lê Viết Quốc – hai nhà nghiên cứu của Google Brain, công bố thuật toán tìm kiếm kiến trúc tự động cho mạng nơ ron (Neural Architecture Search – NAS). Thuật toán này cho phép con người có thể thiết kế một không gian các kiến trúc khả quan của mạng nơ ron, rồi tự động tìm kiếm kiến trúc tốt nhất trong không gian đó, thay vì phải thử từng trường hợp. Có ý nghĩa đóng góp lớn trong phát triển trí tuệ nhân tạo, NAS vẫn có nhược điểm.

Để tạo ra mạng nơ ron tối ưu, cần tới quá trình phân tích, chọn lựa, chẳng hạn 16.000 mạng nơ ron – đồng nghĩa với việc cần khoảng 400 máy tính chạy liên tục trong 3-4 tuần để tìm ra kiến trúc tối ưu. Giải thuật như vậy chỉ có Google hay Facebook mới có khả năng thực hiện. Một nhà nghiên cứu của Microsoft nói đùa  rằng, nếu tuần này “chạy thí nghiệm NAS thì tôi cho cả nhóm nghỉ, vì NAS sẽ chiếm hết một cụm máy chủ, chẳng còn máy cho mọi người làm việc.”

Làm thế nào có thể tăng hiệu quả của NAS trở thành bức tường lớn để nhiều nhà khoa học cố gắng đột phá. Thử sức chinh phục trong nhiều năm liền là nguồn cảm hứng, thúc đẩy Hiếu tham gia con đường dài khám phá chân trời khoa học. “Tôi bị cho là người mê thi,” Hiếu nói và cười khi kể lại chặng đường tìm đến toán học từ lúc còn là học sinh phổ thông cơ sở cho tới lúc cậu học sinh lớp 11 trường Phổ thông Năng khiếu (đại học Quốc gia TP.HCM) đoạt huy chương bạc kỳ thi Toán quốc tế (IMO) năm 2009.

Nó cũng không dừng lại khi chàng trai quê gốc Hà Nội học năm thứ hai và ba ở đại học Stanford. Ở bậc đại học, khi các kỳ thi toán hết hấp dẫn, anh thử sức ở lĩnh vực lập trình. Do giới hạn chỉ được thi tối đa hai lần kỳ thi lập trình viên quốc tế, Hiếu phải dừng cuộc chơi.

Điều đó cũng dẫn anh tới một con đường mới. Do bận chuẩn bị cho các kỳ thi lập trình viên, Hiếu phải nợ một số môn học. “Thế là tôi đăng ký hai môn cùng với thầy Christopher Manning trong một học kỳ,” Hiếu kể về cơ duyên gặp gỡ với giáo sư Manning, người hướng dẫn của anh và Lương Minh Thắng tại Stanford.

Thời gian ngắn, khối lượng bài vở nhiều, nên Hiếu thường xuyên gặp gỡ thầy để hỏi, thảo luận các đề tài liên quan đến hai môn học. Cũng từ đó, anh nhận thấy, lĩnh vực trí tuệ nhân tạo có nhiều bài toán lớn chưa được giải quyết.

“Mất hơn 11 tháng với không ít lần thất bại, nhóm của tôi cũng tìm ra phương pháp cải tiến – mà chúng tôi gọi tắt là ENAS,” Hiếu, 27 tuổi, cho biết trong lần phỏng vấn với Forbes Việt Nam qua mạng. “Thay vì để máy phải chạy thử, tính toán trên 10 ngàn mạng neuron, phương pháp mới chỉ chạy một mạng nhưng sau một vài giai đoạn chạy, máy tự nhìn lại, điều chỉnh và chạy tiếp.”

Kết quả, theo Hiếu, gần xấp xỉ với NAS, nghĩa là không được “tốt bằng”, bù lại khối lượng tính toán – thuật ngữ chuyên ngành gọi là độ phức tạp – giảm đi rất nhiều. “Điều này mở ra cơ hội cho rất nhiều đơn vị nghiên cứu không đủ điều kiện như các công ty công nghệ giàu có có thể xây dựng, phát triển mạng nơ ron của riêng họ.”

Nếu nhìn các bảng thành tích của Hiếu từ cuối cấp 1 lên tới cấp 3, từ giải nhất toán học bậc tiểu học, huy chương vàng giải toán quốc tế bậc tiểu học trong kỳ thi ở Ấn Độ, huy chương bạc IMO, ít người nghĩ rằng chặng đường ấy khởi đầu từ một lần Hiếu có kết quả không tốt.

“Năm lớp bốn, cả lớp thi toán được 10 điểm, chỉ mình tôi điểm chín, nên về nhà tôi nói dối là được 10.” Nhận sự trách phạt của bố mẹ, Hiếu được gia đình cho học thêm vì “yếu toán”. Thầy dạy nhận ra, cậu học sinh ấy nắm vững kiến thức, nhưng lỗi là do làm bài không cẩn thận. Sau lần ấy, Hiếu trở thành một học sinh “điềm đạm, cẩn trọng,” khi trình bày bài, như lời kể của TS Trần Nam Dũng, phó hiệu trưởng trường phổ thông năng khiếu (thuộc ĐH Quốc gia TP.HCM).

Học trò năm lớp 10 của ông trở thành một điển hình ông hay dùng để truyền cảm hứng, cách học cho các học sinh. Vị giáo viên toán giàu kinh nghiệm quan sát được học trò của mình ngay từ lớp 10 đã có “cách làm việc khoa học, cố gắng hiểu bài trên lớp, ghi tóm tắt điểm chính để về nhà trình bày lại.”

Hiếu vẫn giữ thói quen ấy cả khi học đại học. Sau mỗi môn học, anh đều tự làm tài liệu, lưu lại dưới định dạng PDF để thỉnh thoảng xem lại. “Với tôi, tìm được một cách giải hay cũng giống như tạo ra tác phẩm đẹp trong nghệ thuật. Mình phải biết cách trình bày một cách rõ ràng, cẩn thận. Làm như vậy cũng là cách trân trọng giá trị lao động của chính mình,” anh nói.

Gương mặt 30 Under 30 Phạm Hy Hiếu: Đi tìm cánh cửa thứ ba - ảnh 2

Cách học sau mỗi lần va vấp hay thất bại như vậy giúp Hiếu có thể đi xa hơn, kể cả lần thất bại năm lớp 12 không được vào đội tuyển toán quốc gia đi thi IMO. Với ông Dũng, thất bại đó “cần thiết” để Hiếu “hoàn thiện bản thân, tạo nên sức bật.”

TỪ KHẢ NĂNG TỰ HỌC, NGHIÊN CỨU GIÚP HIẾU NHẬN RA VẺ ĐẸP CỦA SỰ SÁNG TẠO khi tìm ra cách giải, cách tiếp cận mới. Anh đúc kết điều ấy trong bài luận 600 chữ trong hồ sơ gửi cho đại học Stanford. Chàng trai đến từ châu Á chọn câu chuyện luyện kiếm của Dương Quá, một nhân vật trong truyện kiếm hiệp của Kim Dung – qua ba cánh cửa.

Sau cánh cửa thứ nhất và thứ hai lần lượt có kiếm sắt và cây gậy, cánh cửa thứ ba chẳng có gì. Người luyện võ khi đến cảnh giới cao nhất chẳng cần vũ khí cụ thể. Tương tự vậy, trong bộ môn hình học – môn Hiếu có thế mạnh – sau giai đoạn sử dụng định lý để giải, tới giai đoạn hình dung bức tranh tổng quát, và cuối cùng là tự vận dụng các điều kiện trong đề bài để đưa ra một lời giải mới, sáng tạo và đẹp. Cánh cửa thứ ba đưa Dương Quá trở thành cao thủ thượng thừa, còn Hiếu qua bài luận đó, mở được cánh cửa vào Stanford.

Công bố về ENAS, theo Hiếu, đóng vai trò quan trọng trong luận án tiến sĩ mà anh đang viết, dự kiến bảo vệ năm 2021. Hiếu hào hứng kể về việc nhiều nhóm ứng dụng đang sử dụng ENAS để mở rộng, phát triển mạng nơ ron riêng. “Tôi nghĩ với các thành tựu hiện tại và tương lai, con người sẽ ngày càng ít phải nhúng tay vào mô hình trí tuệ nhân tạo,” Hiếu chia sẻ về triển vọng phát triển ngành mà anh và các bậc đàn anh như Lê Việt Quốc, Lương Minh Thắng đang tham gia phát triển.

Vậy còn cánh cửa thứ ba? Anh không trực tiếp trả lời câu hỏi này. Hiếu chỉ nói: “Tôi đang nghĩ tới hướng tiếp cận nằm giữa NAS và ENAS.” Trong khi NAS có kết quả tốt nhưng độ phức tạp cao, thì ENAS tuy đơn giản, nhưng kết quả chưa bằng NAS. “Lối đi mới sẽ là phương pháp có kết quả tốt và độ phức tạp thấp hơn,” Hiếu giải thích.

(*) Bản in theo tạp chí Forbes Việt Nam số 81, tháng 2.2020

Đọc thêm>>>
CEO Rens Original Trần Bảo Khánh: Theo làn sóng xanh
Under 30 Nguyễn Tuấn Cường: Đu đưa với âm nhạc
Đam mê dẫn lối sự nghiệp ba gương mặt 30 Under 30 Forbes Việt Nam
7 người trẻ Việt vào danh sách 30 Under 30 của Forbes châu Á
Đại diện 30 Under 30 FVN vào danh sách 30 Under 30 châu Âu
Forbes Vietnam công bố danh sách 30 Under 30 năm 2020 

"Những người dân khỏe mạnh là tài sản lớn nhất của bất cứ quốc gia nào". ---- Winston Churchill - Chính trị gia

Tạp chí Forbes Việt Nam

Số 86 tháng 7.2020

 Số 86 tháng 7.2020

Bao Forbes Vietnam so 74
 
  • - KỲ VỌNG LÀN SÓNG THỨ TƯ

    30 Công ty lớn nhất trong danh sách Golbal 2000 đầu tư trực tiếp vào Việt Nam. Nhìn lại ba làn sóng đầu tư trong 30 năm qua để kỳ vọng vào làn sóng thứ tư.

  • - TÁO MỸ TRỒNG ĐẤT VIỆT

    Việt Nam chính thức xuất hiện trong báo cáo về các nhà cung ứng của Apple. Hướng đi sắp tới: sản xuất tại Việt Nam ?

  • - TRONG TỔ SẾU ĐẦU ĐÀN

    Khu công nghệ cao TP.HCM đón các doanh nghiệp công nghệ và thu hút ngành phụ trợ.

  • HƯỚNG ĐI KHÁC BIỆT

    Bất động sản công nghiệp nóng lên với sự dịch chuyển chuỗi sản xuất của nhà đầu tư nước ngoài. Quy mô khiêm tốn nhưng khu công nghiệp Long Hậu có hướng phát triển riêng

  • - 25 DOANH NGHIỆP MỸ PHẢN ỨNG SỚM NHẤT TRƯỚC COVID-19

    Bảng xếp hạng mới của Forbes hợp tác với đối tác nghiên cứu Just Capital, đánh giá phản ứng của 100 doanh nghiệp lớn nhất trên sàn chứng khoán Hoa Kỳ trong đại dịch COVID-19 về khía cạnh hỗ trợ và bảo vệ người lao động, khách hàng và cộng đồng.

  • - NHỮNG CÔNG TY KHỞI NGHIỆP TỈ ĐÔ TIẾP THEO - GƯƠNG THẦN

     Nghệ sĩ ba lê Brynn Putnam có được nguồn doanh thu đột biến 300 triệu đô la Mỹ nhờ một thiết bị tập luyện tương tác có thể treo ở bất cứ nơi đâu trong nhà

  • - DANH SÁCH CELEBITY 100