Đấu trường AI- Reinforcement Learning Competition do FPT Software tổ chức mang đến cơ hội rèn luyện kỹ năng và học hỏi kinh nghiệm từ các chuyên gia đầu ngành cho gần 1.000 kỹ sư CNTT.
Qua 3 tuần đăng ký, đã có gần 1.000 thí sinh người Việt chia làm 445 đội đến từ Việt Nam và nhiều quốc gia khác như Nhật Bản, Hàn Quốc, Đức, Mỹ… xác nhận cùng tranh tài tại Đấu trường AI- Reinforcement Learning Competition (Đấu trường Trí tuệ nhân tạo – Học tăng cường) có tổng giải thưởng 500 triệu đồng, trong đó, riêng giải nhất có giá trị tới 100 triệu đồng.
Phần lớn thí sinh đăng ký tham gia là những kỹ sư CNTT có nhiều năm kinh nghiệm trong lĩnh vực AI. Trong đó, có khá nhiều nhóm thí sinh có tới 7-10 năm kinh nghiệm làm việc trong các lĩnh vực ứng dụng trực tiếp AI như tự động hóa, phát triển xe tự hành, y tế … tại nhiều quốc gia trên thế giới.
Với mong muốn hỗ trợ các thí sinh về chuyên môn, cách thức thi đấu, trong thời gian gần 3 tuần qua, Ban tổ chức thông qua các hoạt động livestream đã chia sẻ kết nối các cố vấn và giám khảo của cuộc thi với thí sinh. Nhóm cố vấn tham gia tư vấn gồm có ông Nguyễn Xuân Phong - chuyên gia AI quốc tế, cộng tác tại Viện nghiên cứu Trí tuệ nhân tạo Mila, ông Vũ Hữu Tiệp - kỹ sư về Học máy tại Tập đoàn Google. Và bộ ba giám khảo là ông Ngô Quốc Hưng - nhà sáng lập của Trung tâm tài năng AI (COTAI); ông Nguyễn Đỗ Văn - Giám đốc Nghiên cứu và Phát triển tại Viện Trí tuệ nhân tạo Việt Nam; ông Cao Văn Việt - nhà sáng lập CodeLearn, nền tảng học và thi lập trình trực tuyến.
Để chuẩn bị cho vòng đấu loại "Đón đầu thách thức" diễn ra từ nay cho đến ngày 3/9, thí sinh được tư vấn phương thức xây dựng một agent (máy) cao cấp bằng cách lập trình áp dụng thuật toán Reinforcement Learning. Agent ảo này sẽ thi đấu với agent của ban tổ chức để tìm đường vượt qua các bẫy trong trò chơi, loại được nhiều đối thủ nhất, tìm mỏ và đào được nhiều vàng nhất.
Thách thức đặt ra là thí sinh tham gia thi đấu phải liên tục đào tạo và nâng cấp "não bộ" cho các agent của mình có khả năng tự thu thập các nước đi, luật chơi và tính toán chiến thuật, đường đi nước bước vượt qua agent của Ban tổ chức. Luật chơi này được nhóm chuyên gia cố vấn của cuộc thi thể hiện trên chính nguyên lý của thuật toán Reinforcement Learning là học và tích lũy kinh nghiệm để đưa ra hành động tương tác với môi trường. Hành động đúng được máy lưu lại, sai hoặc không mang lại kết quả bị loại bỏ
Game đào vàng thi trên nền tảng CodeLearn của FPT Software.
FPT Software không chỉ tích cực nghiên cứu, ứng dụng AI vào chính các sản phẩm công nghệ của mình, mà còn mở ra hướng đầu tư phát triển công nghệ Trí tuệ nhân tạo từ chính những nhánh quan trọng của AI là Reinforcement Learning. Thông qua việc cung cấp kiến thức và ứng dụng qua các vòng thi, công ty mong muốn cộng đồng AI có thêm sân chơi, thể hiện năng lực lập trình với thuật toán này, cũng như góp phần xây dựng nguồn nhân lực cho thị trường công nghệ AI Việt. Cuộc thi sẽ mang tới cho giới kỹ sư CNTT cơ hội học tập, nghiên cứu sâu và học hỏi kinh nghiệm từ các chuyên gia hàng đầu trong lĩnh vực này, đồng thời tiếp cận nhiều cơ hội nghề nghiệp hấp dẫn tại FPT Software.
Mỗi cá nhân hoặc đội thi có thể tự tạo ra một agent ảo bằng thuật toán Reinforcement Learning để học được cách phản ứng và đưa ra các quyết định một cách có chiến thuật và thông minh, đối đầu lại với những đội khác. Một trong những điều ấn tượng của thuật toán này đó là có thể khám phá các tri thức mới, thành lập các chiến thuật phức tạp, và điều này phần nào đã được chứng minh qua việc thuật toán chinh phục các game khó nhất từ thể thao điện tử (như Dota2, Starcraft II) cho đến các loại cờ (cờ vây, cờ vua).
"Thông qua cuộc thi FPT Software kỳ vọng mang tới thách thức chinh phục thuật toán mới, nâng cao năng lực kiến thức cho các kỹ sư CNTT, nhưng cũng mở ra cơ hội nghiên cứu và đưa ra nhiều đóng góp cho công nghệ AI nói chung và Reinforcement Learning nói riêng", Đại diện Ban Tổ chức nói.