MACHINE LEARNING

Chi tiết khóa học

Giới thiệu về Machine Learning (ML)

  • Chương trình ML
  • Khả năng khai thác tri thức từ dữ liệu của ML
  • Tác nhân thúc đẩy ML
  • Phân biệt các khái nhiệm ML, Data Science, AI, IoT, Big-data
  • Các bài toán ML – Supervised và Unsupervised Learning
  • Tối tương quan giữa ML và Thống kê

Lập trình dữ liệu với Python

  • Jupyter notebook
  • Python cơ bản
  • Numpy và Pandas
  • Biểu diễn đồ thị với python (Matplotlib, Seaborn, Pandas)

Mô hình Regression

  • Giới thiệu
  • Bài toán Regression 1 biến
  • Các khái niệm Cost Function, Gradient Descent
  • Thực hành và đánh giá Regression nhiều biến
  • Các khái niệm Generalization, Capacity, Overfitting and Underfitting
  • Các khái niệm training, validation, testing, bias và variance
  • Ôn tập về Đại số tuyến tính
  • Thực hành và đánh giá Regression nhiều biến
  • Biến đổi biến trong Regression
  • Các vấn đề lưu ý với Regression: phân tích residuals, collinearity, cách xây dựng mô hình
  • Hồi quy đa thức

Hồi quy Logistics

  • Bài toán phân loại
  • Giả thuyết và biên quyết định
  • Hàm Cost và tối ưu
  • Regularization trong Regression
  • Thực hành Logistic trên dữ liệu thực tế

Mô hình cây quyết định

  • Thực hành và đánh giá Mô hình cây quyết định
  • Bootstraping dữ liệu
  • Mô hình Bagging và Random forest
  • Mô hình Boosting
  • So sánh mô hình cây và SVM

Các mô hình Unsupervised Learning

  • Mô hình K-means clustering
  • Mô hình Hierarchical clustering
  • Mô hình Association rules

Các hệ thống khuyến nghị (Recommender Systems)

  • Content Based Recommendations
  • Collaborative Filtering

Thực hành Dự án ML

  • Xử lý dữ liệu văn bản (Text)
  • Lấy dữ liệu, tiền xử lý dữ liệu văn bản
  • Phương pháp TFIDF
  • Phân loại văn bản: Topic modeling & Sentiment analysis
  • Machine Learning trên dữ liệu lớn (Big-data)
  • Giới thiệu về Neural Network và Deep Learning