Thời đại ngày nay mỗi người chúng ta cần trang bị những công cụ và phương pháp mới để làm chủ và khai thác được giá trị từ dữ liệu của mình.  Các phương pháp giảng dạy của S-LAB với ngôn ngữ R đã giúp hàng trăm học viên tiếp cận Khoa học dữ liệu một cách dễ dàng và hiệu quả, với nội dung bao gồm những khai phá dữ liệu cơ bản, biểu diễn với Tableau, các mô hình thống kê và dự báo cho tương lai.

ĐỐI TƯỢNG HỌC VIÊN

  • Bạn đang gặp khó khăn khi xử lý dữ liệu hàng ngày với Excel vì:
    • Giới hạn số dòng < 1,000,000. Làm sao tổng hợp mọi giao dịch trong 10 năm?
    • Các thao tác vlookup, pivotable, replace quá chậm với hàng chục ngàn dòng
    • Lặp lại một thao tác nhiều lần, nhiều ngày cho mỗi cửa hàng
    • Chưa có mô hình dự báo nào?
  • Bạn tổng hợp dữ liệu nhưng chưa hiển thị được xu hướng tổng quan, những điểm hiệu quả hay bất thường của hoạt động kinh doanh? Chưa có báo cáo hình ảnh, dashboard chuyên nghiệp
  • Bạn là muốn biết Machine Learning làm được gì? muốn tìm hiểu các mô hình AI?
  • Bạn là một quản lý, làm sao tăng giá trị và năng suất của doanh nghiệp với các mô hình Machine Learning?
  • Bạn là sinh viên, cần chuẩn bị kỹ năng cho công việc thời đại 4.0

KẾT QUẢ NHẬN ĐƯỢC

  • Thành thạo lập trình ngôn ngữ R
  • Khai phá dữ liệu: tổng hợp, làm sạch, chuẩn hóa, biến đổi dữ liệu kinh doanh
  • Biểu diễn hình ảnh và tạo lập các báo cáo Business Intelligence hiệu quả
  • Sử dụng các phương pháp thống kê để phân tích dữ liệu kinh doanh
  • Xây dựng các mô hình dự báo xu hướng và rủi ro
  • Làm chủ quá trình triển khai dự án khoa học dữ liệu trong Doanh nghiệp

CÔNG VIỆC PHÙ HỢP:

  • Data analyst
  • Business analyst
  • Business Intelligence analyst
  • Machine Learning specialist
  • Data Manager
CÁC BỘ DỮ LIỆU THỰC HÀNH:
  1. Car price: Dự báo giá xe cũ
  2. Churn customer: Dự báo khách hàng chuyển mạng viễn thông
  3. Home credit default customer: Dự báo khách hàng nợ xấu
  4. Bikesharing: Dự báo số lượt thuê xe đạp
  5. Old car price: Dự báo giá xe cũ
  6. US College: Phân cụm các trường học ở Mỹ
  7. Vietnamese retail shop: Phân tích giỏ hàng siêu thị VN

CÁC MÔ HÌNH MACHINE LEARNING:

  1. Hồi quy tuyến tính
  2. K-Nearest Neighbors (KNN)
  3. Hồi quy Logistics
  4. Decision Tree
  5. Random Forest
  6. Naive Bayes
  7. K-mean Clustering
  8. Hierarchical Clustering
  9. Association Rules
  10. Neural Network

Công cụ, phần mềm: R, RStudio, RMarkdown, Tableau

Chi tiết khóa học

Tổng Quan

  • Giá trị của Dữ liệu và vai trò của Khoa học dữ liệu
  • Cách nhận diện bài toán Dữ liệu trong DN
  • Giới thiệu công cụ: R, Rstudio, Markdown, Git
  • Ngôn ngữ lập trình R: từ cơ bản đến nâng cao

Xử lý dữ liệu kinh doanh:

  • Tải dữ liệu, tổng hợp, xây dựng từ điển dữ liệu
  • Ghép nối dữ liệu

Khai phá dữ liệu kinh doanh (EDA):

  • Thống kê đơn biến phân loại và liên tục
  • Thống kê đa biến, nhóm dữ liệu
  • Biểu diễn hình ảnh dữ liệu với ggplot2
  • Nhóm dữ liệu
  • Phân tích xu hướng

Biến đổi dữ liệu:

  • Làm sạch dữ liệu
  • Chuẩn hóa dữ liệu
  • Tìm kiếm điểm bất thường
  • Giảm chiều dữ liệu
  • Tạo biến mới từ dữ liệu

Thống kê dữ liệu:

  • Phân tích tương quan
  • Các kiểm định và độ tin cậy: so sánh trung bình
  • So sánh trung bình với phương pháp phân tích phương sai (ANOVA)
  • Bootstraping dữ liệu

Mô hình Hồi quy:

  • Phương pháp bình phương tối thiểu
  • Hồi quy đơn biến
  • Phân tích sai số
  • Hồi quy đa biến
  • Hồi quy logistics

Cơ bản về Machine Learning:

  • Mô tả các bài toán Machine Learning
  • Các mô hình hồi quy và cây quyết định
  • Các khái niệm training, validation, testing, bias và variance
  • Regularization
  • Bài toán tối ưu, phương pháp gradient descent
  • Các mô hình không giám sát
  • Quy trình dự án Machine Learning
  • Cách chuyển đổi bài toán doanh nghiệp thành bài toán ML
  • Trình bày kết quả dự án ML