Machine Learning

Học máy là cách lập trình để máy tính tự học ra kiến thức từ dữ liệu, khai phá nguồn dữ liệu hiện có bắt chúng phục vụ cho các hoạt động doanh nghiệp một cách tự động.

Machine Learning đang trở thành công cụ phổ biến trong nhiều ứng dụng: tự xét duyệt tín dụng tự động đến khuyến nghị mua hàng, từ soạn thảo nội dung email hay phân loại khách hàng, từ dự báo doanh số đến nhận dạng nội dung văn bản,… Nắm rõ các thuật toán Machine Learning và ứng dụng tốt trong doanh nghiệp sẽ nâng cao hiệu quả và năng lực của bạn rõ rệt.

CHƯƠNG TRÌNH HỌC

  • Giới thiệu về Machine Learning (ML)
    • Chương trình ML
    • Khả năng khai thác tri thức từ dữ liệu của ML
    • Tác nhân thúc đẩy ML
    • Phân biệt các khái nhiệm ML, Data Science, AI, IoT, Big-data
    • Các bài toán ML – Supervised và Unsupervised Learning
    • Tối tương quan giữa ML và Thống kê
  • Lập trình dữ liệu với Python
    • Jupyter notebook
    • Python cơ bản
    • Numpy và Pandas
    • Biểu diễn đồ thị với python (Matplotlib, Seaborn, Pandas)
  • Mô hình Regression
    • Giới thiệu
    • Bài toán Regression 1 biến
    • Các khái niệm Cost Function, Gradient Descent
    • Thực hành và Đánh giá bài toán Regression
    • Các khái niệm Generalization, Capacity, Overfitting and Underfitting
    • Các khái niệm training, validation, testing, bias và variance
    • Ôn tập về Đại số tuyến tính
    • Regression nhiều biến
    • Thực hành và đánh giá Regression nhiều biến
    • Biến đổi biến trong Regression
    • Các vấn đề lưu ý với Regression: phân tích residuals, collinearity, cách xây dựng mô hình
    • Hồi quy đa thức
  • Hồi quy Logistics
    • Bài toán phân loại
    • Giả thuyết và biên quyết định
    • Hàm Cost và tối ưu
    • Regularization trong Regression
    • Thực hành Logistic trên dữ liệu thực tế
  • Mô hình Support Vector Machine (SVM) và Naive Bayes
  • Mô hình cây quyết định
    • Thực hành và đánh giá Mô hình cây quyết định
    • Bootstraping dữ liệu
    • Mô hình Bagging và Random forest
    • Mô hình Boosting
    • So sánh mô hình cây và SVM
  • Các mô hình Unsupervised Learning
    • Mô hình K-means clustering
    • Mô hình Hierarchical clustering
    • Mô hình Association rules
  • Các hệ thống khuyến nghị (Recommender Systems)
    • Content Based Recommendations
    • Collaborative Filtering
  • Xử lý dữ liệu văn bản (Text)
  • Lấy dữ liệu, tiền xử lý dữ liệu văn bản
  • Phương pháp TFIDF
  • Phân loại văn bản: Topic modeling & Sentiment analysis
  • Machine Learning trên dữ liệu lớn (Big-data)
  • Giới thiệu về Neural Network và Deep Learning

Thực hành Dự án ML

KẾT QUẢ NHẬN ĐƯỢC

  • Thành thạo lập trình ngôn ngữ Python
  • Dễ dàng xử lý, tổng hợp, làm sạch, chuẩn hóa, biến đổi, khai phá & biểu diễn hình ảnh dữ liệu với Python
  • Nắm bắt các khái niệm từ cơ bản đến chuyên sâu về Machine Learning
  • Thực hành các mô hình ML để khai phá tri thức và dự báo từ dữ liệu

Khai thác dữ liệu lớn với ML, triển khai hiệu quả các dự án ML trong doanh nghiệp

ĐỐI TƯỢNG HỌC VIÊN:

  • Sinh viên và những người đam mê chương trình máy học
  • Business Analyst (marketing, sale, finance,…)
  • Data Analyst
  • Data Engineer
  • Software Developer
  • Junior Data scientist
  • Business Manager