Meetup 6

Diễn giả: Khang Phạm Tiêu đề: Word embedding Note: từ tháng này, các event sẽ đổi tên thành VN Machine Learning Meetup (lần này là lần thứ 6 trong 1 năm qua ^^) Xử lý các bài toán về Text là 1 vấn đề khá khó nhưng có rất nhiều ứng dụng trong thực tiễn: sentiment analytics, machine translation, chatbot… Cái khó khi xử lý text là việc text không phải số như ảnh nhưng các từ trong 1 từ điển nếu xử lý như 1 biến độc lập thì sẽ bỏ qua rất nhiều chi tiết về ngữ nghĩa của từ và văn bản. Giải quyết bài toán biến các từ trong 1 bộ từ điển thành những dense-vector từ lâu đã trở thành bài toán cơ bản đầu tiên khi xử lý text và đã có rất nhiều thuật toán thông dụng như word2vec hay fasttext (facebook). Trong bài nói này mình sẽ giới thiệu lý thuyết cơ bản của các thuật toán này