BUSINESS ANALYTICS

Trong bất kỳ ngành kinh doanh nào hiện nay - tài chính, vận hành, sale, marketing, quản trị,... - chúng ta cũng đều đối mặt với một lượng dữ liệu lớn.

 

Làm sao để khai thác những dữ liệu này đúng phương pháp, tìm ra những thông tin quan trọng hỗ trợ ra quyết định kinh doanh?

Khóa học Phân tích Dữ liệu Kinh doanh của S-Lab tập trung vào việc phân tích sâu và đa chiều dữ liệu doanh nghiệp, triển khai các mô hình dự báo, chấm điểm khách hàng (Scorecard), kinh tế lượng và phân tích chuỗi thời gian như là kiến thức nền tảng ngày nay.

KẾT QUẢ ĐẠT ĐƯỢC:

  • Khai phá dữ liệu doanh nghiệp, tìm kiếm các dấu hiệu và mối quan hệ:
    • Giữa các biến rời rạc như mặt hàng, địa điểm, nhà phân phối,…
    • Giữa các biến liên tục như doanh thu, chi phí, thu nhập khách hàng,…
    • Xu hướng theo thời gian
  • Xây dựng các mô hình dự báo, xác định xác suất trả nợ, chấm điểm khách hàng,…
  • Nhận dạng một bài toán Dữ liệu trong kinh doanh, tìm kiếm cơ hội gia tăng giá trị từ khai thác dữ liệu (hiện có và tiềm năng)
  • Chuyên nghiệp hóa Excel trong phân tích và xây dựng mô hình
  • Sử dụng các công cụ tiên tiến trong phân tích dữ liệu (R)

CHƯƠNG TRÌNH HỌC TỔNG QUAN (3 NGÀY):

  • Phần 1: Giới thiệu về giá trị của Dữ liệu
  • Phần 2: Phân tích dữ liệu cơ bản theo: biến rời rạc, biến liên tục, biến thời gian
  • Phần 3: Mô hình dự báo doanh thu, chi phí
  • Phần 4: Mô hình dự báo xác suất trả nợ, xác suất rời bỏ dịch vụ, chấm điểm khách hàng
  • Phần 5: Các mô hình dự báo theo thời gian

Thực hành trên các bộ dữ liệu thực với Excel và R (mã nguồn mở)

ĐỐI TƯỢNG THEO HỌC:

  • Chuyên viên phân tích dữ liệu thuộc các phòng ban tài chính, marketing, vận hành, logistics, nhân sự, sale, marketing.
  • Trưởng nhóm, trưởng phòng, nhà quản lý doanh nghiệp


Business Intelligence with PowerBI

Khóa học "Khai phá Dữ liệu Doanh nghiệp với PowerBI"

Khai giảng: 11/2019 - Địa điểm: HN/TPHCM

Liên hệ: 0399678936 - info@s-lab.vn - http://s-lab.vn

Facebook: Học Machine Learning và Deep Learning;

 

KẾT QUẢ NHẬN ĐƯỢC

  • Hiểu và sử dụng thành thạo các công cụ khác nhau của PowerBI
  • Sử dụng Query Editor để kết nối và xây dựng cấu trúc dữ liệu
  • Xây dựng các bảng, đồ thị khác nhau từ dữ liệu doanh nghiệp
  • Xác định các quan hệ giữa các yếu tố ảnh hưởng, xây dựng và đo lường các phép đo mới
  • Xây dựng các bảng/màn trực quan tương tác (Dashboard)
  • Chia sẻ các kết quả phân tích và truy cập từ các thiết bị khác nhau

ĐỐI TƯỢNG PHÙ HỢP

- Muốn tìm hiểu và bắt đầu với PowerBI

- Sử dụng PowerBI để khai phá tri thức trong dữ liệu

- Xây dựng các màn hình dữ liệu trực quan hỗ trợ ra quyết định

 

CHƯƠNG TRÌNH HỌC: 15h - 2 ngày Thứ 7 - CN từ 8h30 - 17h

Phần 1: Giới thiệu

  • Giới thiệu khóa học
  • Giới thiệu bộ công cụ PowerBI
  • Cài đặt và khởi động dự án đầu tiên
    • Kết nối nhanh dữ liệu
    • Xây dựng kiến trúc dữ liệu và đồ họa
  • Giới thiệu chi tiết nội dung khóa học

Phần 2: Công cụ PowerBI bản Desktop

  • Giới thiệu Workflow
  • Xây dựng Data Model
  • Query dữ liệu với Query Editor
  • Tương tác, truy vấn dữ liệu
  • Biến đổi, làm sạch dữ liệu
  • Tách biến, tạo biến từ dữ liệu

Phần 3: Mô hình dữ liệu và quan hệ

  • Xây dựng mô hình dữ liệu với Data Model
  • Biểu diễn các mối quan hệ dữ liệu
  • Giới thiệu M-Language và DAX
  • Phân tích dữ liệu phân loại

Phần 4: Xây dựng báo cáo

  • Workflow cho báo cáo
  • Khởi tạo các biểu diễn hình ảnh (visualization)
  • Màu sắc, thông tin, tương tác trên hình ảnh
  • Biến cấp bậc, drill-down dữ liệu
  • Thay đổi format và sắp xếp
  • Format và lọc dữ liệu
  • Các kiểu đồ thị khác nhau

Phần 5: Xây dựng màn hình dữ liệu và Kết nối

  • Workflow cho màn hình dữ liệu
  • Xây dựng mà hình dữ liệu (Dashboard)
  • Cộng tác và chia sẻ qua App Workspaces
  • Thực hành xây dựng các màn hình khác nhau

Phần 6: Các công cụ nâng cao

  • Kết nối nhiều nguồn dữ liệu khác nhau
  • Xây dựng báo cáo và màn hình chuyên biệt
  • Giới thiệu và cài đặt d3.js (Data Driven Documents)
  • Truy xuất dữ liệu
  • Hiển thị thông tin người dùng
  • Đặc tính nâng cao

 

CÁC BỘ DỮ LIỆU DOANH NGHIỆP THỰC HÀNH

- Dữ liệu bán hàng toàn quốc

- Dữ liệu khách hàng vay nợ tiêu dùng

- Dữ liệu giáo dục Việt Nam


DATA FUNDAMENTALS FOR MANAGERS

DATA FUNDAMENTALS FOR MANAGERS

Thấu hiểu tầm quan trọng và định lượng giá trị của Dữ liệu trong Doanh nghiệp

Khóa học tập trung vào vai trò và giá trị của Dữ liệu trong Doanh nghiệp, giới thiệu các mô hình, công cụ và chiến lược liên quan. Đặc biệt, các ví dụ được lấy từ các bộ dữ liệu doanh nghiệp và thực hành trên các công cụ kéo thả là Tableau và BigML*, giúp học viên nhanh chóng nắm bắt các khái niệm và bản chất. Sau khóa học, các học viên có thể ước lượng được giá trị mà dữ liệu có thể mang lại cho doanh nghiệp mình, và lên kế hoạch để triển khai quá trình chuyển đổi.


CHƯƠNG TRÌNH HỌC (2 ngày cuối tuần từ 8h30-17h00)

Phần 1: Giá trị từ dữ liệu

  • Dữ liệu là gì?
  • Vì sao dữ liệu trở nên quan trọng?
  • Phân tích Dữ liệu mang lại giá trị gì cho doanh nghiệp?
  • Sự dịch chuyển của tri thức và năng lực cạnh tranh
  • Các phương pháp khai phá dữ liệu là gì và như thế nào?
  • Các công cụ và nền tảng
  • Case Studies: các doanh nghiệp đã sử dụng giải pháp analytics (Facebook, Target, HomeCredit)
  • Thực hành: xác định giá trị dữ liệu của doanh nghiệp bán lẻ

Phần 2: Nắm bắt tổng quan dữ liệu doanh nghiệp

  • Tập trung dữ liệu và Datawarehouse
  • Chuẩn hóa và chuẩn bị dữ liệu
  • Nhanh chóng nắm bắt bức tranh tổng quan
  • Tạo các biểu diễn hình ảnh, dashboard và câu chuyện dữ liệu
  • Thực hành: Business Intelligence với Tableau
    – Dữ liệu doanh nghiệp bán lẻ với Tableau
    – Dữ liệu ngân hàng với Tableau

Phần 3: Tăng năng suất kinh doanh với máy học

  • Machine Learning là gì? AI là gì?
  • Sự khác nhau giữa Business Intelligence và Machine -Learning và chiến lược của doanh nghiệp
  • Xây dựng và đánh giá mô hình Machine Learning
  • Mô hình giám sát – scoring
  • Mô hình giám sát – classification
  • Mô hình không giám sát – clustering và basket analysis
  • Thực hành: Dự báo giá bất động sản với BigML
  • Thực hành: Dự báo rủi ro tín dụng với BigML
  • Thực hành: Dự báo rủi ro bảo hiểm với BigML
  • Thực hành: Phân cụm khách hàng với BigML
  • Tổng hợp các mô hình Machine Learning

Phần 4: Vượt lên trong thời đại dữ liệu

  • Xây dựng văn hóa Dữ liệu
  • Quy trình 6 bước Analytics and Data Science
  • Big-data là gì và các công cụ của nó
  • Khi nào cần AI và Deep Learning?
  • Kỹ năng và đội ngũ


Mạng neuron học sâu hay Deep Learning là nền tảng chính của các ứng dụng Trí tuệ nhân tạo hiện đang có mặt mọi nơi trong đời sống chúng ta. Từ xe tự lái đến nhận dạng khuôn mặt, từ máy đánh cờ đến bác sỹ khám bệnh ảo, …  
Hiểu rõ về Deep Learning và các ứng dụng AI sẽ giúp bạn tiến xa trong tương lai

Khóa học Deep Learning của S-LAB là level thứ 3 của chương trình “Easy Data Science”, mang tới những kỹ năng cơ bản và nâng cao, thực hành trên dự án AI thực tế, giúp bạn nắm bắt kỹ năng và vượt lên trong thời đại AI 4.0, với các kết quả cụ thể:

  • Thành thạo thiết kế, học và dự đoán với Mạng neuron nhân tạo ANN 
  • Sử dụng thư viện Tensorflow, Keras, OpenCV và YOLO
  • Xử lý hình ảnh, nhận dạng đối tượng với mạng CNN và OpenCV
  • Xử lý ngôn ngữ, phân loại văn bản, xử lý chuỗi thời gian với mạng RNN
  • Phân tích dữ liệu không nhãn với mạng SOM và Auto Encoder
  • Xây dựng máy thông minh nhân tạo/Robot với Học tăng cường và mạng neuron
  • 12 bài toán AI và 02 dự án cuối khóa: Nhận diện bảng số xe và Xây dựng robot xe tự lái

ĐỐI TƯỢNG HỌC VIÊN

  • Sinh viên và những người đam mê Khoa học dữ liệu, AI
  • Chuyên viên dữ liệu, kỹ sư Machine Learning muốn nâng cao trình độ AI
  • Chuyên viên doanh nghiệp mong muốn ứng dụng AI

ĐIỀU KIỆN THEO HỌC

  • Có tư duy logic và đam mê Toán
  • Đã biết ngôn ngữ lập trình Python và các bài toán Machine Learning cơ bản

THỜI GIAN: 30h offline (4 ngày cuối tuần từ 8h30-17h00 hoặc 10 buổi tối từ 18h-21h)

Chi tiết khóa học

Deep Learning (DL) là gì?

  • Vì sao Deep Learning?
  • Tác nhân thúc đẩy Deep Learning?

Ôn tập Đại số tuyến tính

  • Vector, cộng vector, nhân vô hướng, tích vector
  • Ma trận, định thức, nhân ma trận, ma trận nghịch đảo
  • Giá trị riêng, vector riêng, phân tích thành phần chính

Giới thiệu về Mạng Neuron

  • Neuron, cách hoạt động
  • Hàm activation
  • Mạng Neuron (NN) hoạt động thế nào?
  • Mạng Neuron Ảo (ANN) học thế nào?
  • Gradient Descent là gì?
  • Gradient Descent ngẫu nhiên là gì?
  • Lan truyền ngược (Backpropagation) là gì?
  • Thực hành xây dựng NN với python và keras
  • Đánh giá, cải tiến và tinh chỉnh mạng NN: Hyperparameter tuning, Regularization và Optimization

Mạng Neuron Tích chập (CNN)

  • CNN là gì? Vì sao?
  • Cách hoạt động của CNN
  • Hàm ReLu
  • Pooling, Flattening, Full Connection là gì?
  • Softmax và Cross-Entropy?
  • Thực hành xây dựng CNN

Mạng Neuron Hồi quy (RNN)

  • Đánh giá, cải tiến và tinh chỉnh mạng CNN
  • Ý tưởng của mạng RNN
  • Vấn đề suy biến đạo hàm (Vanishing Gradient)
  • Mạng bộ nhớ dài-ngắn (Long Short Term Memory networks)
  • Thực hành xây dựng RNN
  • Đánh giá, cải tiến và tinh chỉnh mạng RNN

Mạng neural tự tổ chức SOM (Self-Organizing Map)

  • Ý tưởng của SOMs là gì?
  • SOMs hoạt động thế nào?
  • Liên hệ với K-Mean
  • Thực hành xây dựng SOM
  • Đánh giá, cải tiến và tinh chỉnh mạng SOM

Mạng AutoEncoders

  • Ý tưởng của AutoEncoders là gì?
  • AutoEncoders hoạt động thế nào?
  • Các biến thể của AutoEncoders

DATA ANALYTICS

Thời đại ngày nay mỗi người chúng ta cần trang bị những công cụ và phương pháp mới để làm chủ và khai thác được giá trị từ dữ liệu của mình.

 

Các phương pháp giảng dạy của S-LAB với ngôn ngữ R đã giúp hàng trăm học viên tiếp cận Khoa học dữ liệu một cách dễ dàng và hiệu quả, với nội dung bao gồm những khai phá dữ liệu cơ bản, biểu diễn với Tableau, các mô hình thống kê và dự báo cho tương lai.

ĐỐI TƯỢNG HỌC VIÊN

  • Bạn đang gặp khó khăn khi xử lý dữ liệu hàng ngày với Excel vì:
    • Giới hạn số dòng < 1,000,000. Làm sao tổng hợp mọi giao dịch trong 10 năm?
    • Các thao tác vlookup, pivotable, replace quá chậm với hàng chục ngàn dòng
    • Lặp lại một thao tác nhiều lần, nhiều ngày cho mỗi cửa hàng
    • Chưa có mô hình dự báo nào?
  • Bạn tổng hợp dữ liệu nhưng chưa hiển thị được xu hướng tổng quan, những điểm hiệu quả hay bất thường của hoạt động kinh doanh? Chưa có báo cáo hình ảnh, dashboard chuyên nghiệp
  • Bạn là muốn biết Machine Learning làm được gì? muốn tìm hiểu các mô hình AI?
  • Bạn là một quản lý, làm sao tăng giá trị và năng suất của doanh nghiệp với các mô hình Machine Learning?
  • Bạn là sinh viên, cần chuẩn bị kỹ năng cho công việc thời đại 4.0

KẾT QUẢ NHẬN ĐƯỢC

  • Thành thạo lập trình ngôn ngữ R
  • Khai phá dữ liệu: tổng hợp, làm sạch, chuẩn hóa, biến đổi dữ liệu kinh doanh
  • Biểu diễn hình ảnh và tạo lập các báo cáo Business Intelligence hiệu quả
  • Sử dụng các phương pháp thống kê để phân tích dữ liệu kinh doanh
  • Xây dựng các mô hình dự báo xu hướng và rủi ro
  • Làm chủ quá trình triển khai dự án khoa học dữ liệu trong Doanh nghiệp

CÔNG VIỆC PHÙ HỢP:

  • Data analyst
  • Business analyst
  • Business Intelligence analyst
  • Machine Learning specialist
  • Data Manager
CÁC BỘ DỮ LIỆU THỰC HÀNH:
  1. Car price: Dự báo giá xe cũ
  2. Churn customer: Dự báo khách hàng chuyển mạng viễn thông
  3. Home credit default customer: Dự báo khách hàng nợ xấu
  4. Bikesharing: Dự báo số lượt thuê xe đạp
  5. Old car price: Dự báo giá xe cũ
  6. US College: Phân cụm các trường học ở Mỹ
  7. Vietnamese retail shop: Phân tích giỏ hàng siêu thị VN

CÁC MÔ HÌNH MACHINE LEARNING:

  1. Hồi quy tuyến tính
  2. K-Nearest Neighbors (KNN)
  3. Hồi quy Logistics
  4. Decision Tree
  5. Random Forest
  6. Naive Bayes
  7. K-mean Clustering
  8. Hierarchical Clustering
  9. Association Rules
  10. Neural Network

Công cụ, phần mềm: R, RStudio, RMarkdown, Tableau

Chi tiết khóa học

Tổng Quan

  • Giá trị của Dữ liệu và vai trò của Khoa học dữ liệu
  • Cách nhận diện bài toán Dữ liệu trong DN
  • Giới thiệu công cụ: R, Rstudio, Markdown, Git
  • Ngôn ngữ lập trình R: từ cơ bản đến nâng cao

Xử lý dữ liệu kinh doanh:

  • Tải dữ liệu, tổng hợp, xây dựng từ điển dữ liệu
  • Ghép nối dữ liệu

Khai phá dữ liệu kinh doanh (EDA):

  • Thống kê đơn biến phân loại và liên tục
  • Thống kê đa biến, nhóm dữ liệu
  • Biểu diễn hình ảnh dữ liệu với ggplot2
  • Nhóm dữ liệu
  • Phân tích xu hướng

Biến đổi dữ liệu:

  • Làm sạch dữ liệu
  • Chuẩn hóa dữ liệu
  • Tìm kiếm điểm bất thường
  • Giảm chiều dữ liệu
  • Tạo biến mới từ dữ liệu

Thống kê dữ liệu:

  • Phân tích tương quan
  • Các kiểm định và độ tin cậy: so sánh trung bình
  • So sánh trung bình với phương pháp phân tích phương sai (ANOVA)
  • Bootstraping dữ liệu

Mô hình Hồi quy:

  • Phương pháp bình phương tối thiểu
  • Hồi quy đơn biến
  • Phân tích sai số
  • Hồi quy đa biến
  • Hồi quy logistics

Cơ bản về Machine Learning:

  • Mô tả các bài toán Machine Learning
  • Các mô hình hồi quy và cây quyết định
  • Các khái niệm training, validation, testing, bias và variance
  • Regularization
  • Bài toán tối ưu, phương pháp gradient descent
  • Các mô hình không giám sát
  • Quy trình dự án Machine Learning
  • Cách chuyển đổi bài toán doanh nghiệp thành bài toán ML
  • Trình bày kết quả dự án ML


MACHINE LEARNING

Machine Learning là tập hợp các thuật toán giúp chúng ta khai thác được tri thức từ dữ liệu một cách tự động. Làm chủ được các thuật toán Machine Learning sẽ giúp bạn mở ra khả năng thu nhận được kiến thức vô hạn với dữ liệu đang có trên thế giới hiện nay.

 

Theo góc độ lập trình, các chương trình Machine Learning không thể hiện các quy tắc hành động một cách tường minh mà tiếp nhận dữ liệu để học ra các quy tắc và hành động tương ứng.

Khóa học “Machine Learning with Python” của S-LAB là level thứ 2 của chương trình “Easy Data Science”, mang tới những kỹ năng cơ bản và nâng cao về các mô hình Machine Learning cho dự báo, phân loại, … là bước quan trọng để làm chủ dữ liệu và chuẩn bị cho những ứng dụng AI tiếp theo.

KẾT QUẢ NHẬN ĐƯỢC

  • Thành thạo lập trình ngôn ngữ Python
  • Xử lý, khai phá & biểu diễn hình ảnh dữ liệu với Python
  • Xây dựng các mô hình Machine Learning: 
    • Hồi quy: dự báo giá nhà, dự báo doanh số film
    • Phân loại: dự báo rủi ro trả nợ, khách hàng rời bỏ dịch vụ
    • Không giám sát: phân cụm khách hàng, hệ thống khuyến nghị
    • Mô hình nâng cao: svm, xgboost
    • Mô hình nâng cao: k-mean và mean-shift cho phân vùng ảnh
    • Mô hình nâng cao: phân cụm phổ cho phân tích dữ liệu mạng xã hội
  • Xây dựng các mô hình Deep Learning cơ bản:
    • Mạng neuron học sâu ứng dụng cho nhận dạng chữ viết tay
    • Mạng neuron tích chập (CNN) cho phân loại đối tượng trong ảnh và video
  • Ôn tập các kiến thức Toán cần thiết
  • Các thư viện Python: Scikit-learn, Tensorflow, Keras

DÀNH CHO HỌC VIÊN MUỐN TRỞ THÀNH

  • Data Analyst
  • Data Engineer
  • Machine Learning specialist
  • Junior Data scientist
  • Data Manager

Chi tiết khóa học

Giới thiệu về Machine Learning (ML)

  • Chương trình ML
  • Khả năng khai thác tri thức từ dữ liệu của ML
  • Tác nhân thúc đẩy ML
  • Phân biệt các khái nhiệm ML, Data Science, AI, IoT, Big-data
  • Các bài toán ML – Supervised và Unsupervised Learning
  • Tối tương quan giữa ML và Thống kê

Lập trình dữ liệu với Python

  • Jupyter notebook
  • Python cơ bản
  • Numpy và Pandas
  • Biểu diễn đồ thị với python (Matplotlib, Seaborn, Pandas)

Mô hình Regression

  • Giới thiệu
  • Bài toán Regression 1 biến
  • Các khái niệm Cost Function, Gradient Descent
  • Thực hành và đánh giá Regression nhiều biến
  • Các khái niệm Generalization, Capacity, Overfitting and Underfitting
  • Các khái niệm training, validation, testing, bias và variance
  • Ôn tập về Đại số tuyến tính
  • Thực hành và đánh giá Regression nhiều biến
  • Biến đổi biến trong Regression
  • Các vấn đề lưu ý với Regression: phân tích residuals, collinearity, cách xây dựng mô hình
  • Hồi quy đa thức

Hồi quy Logistics

  • Bài toán phân loại
  • Giả thuyết và biên quyết định
  • Hàm Cost và tối ưu
  • Regularization trong Regression
  • Thực hành Logistic trên dữ liệu thực tế

Mô hình cây quyết định

  • Thực hành và đánh giá Mô hình cây quyết định
  • Bootstraping dữ liệu
  • Mô hình Bagging và Random forest
  • Mô hình Boosting
  • So sánh mô hình cây và SVM

Các mô hình Unsupervised Learning

  • Mô hình K-means clustering
  • Mô hình Hierarchical clustering
  • Mô hình Association rules

Các hệ thống khuyến nghị (Recommender Systems)

  • Content Based Recommendations
  • Collaborative Filtering

Thực hành Dự án ML

  • Xử lý dữ liệu văn bản (Text)
  • Lấy dữ liệu, tiền xử lý dữ liệu văn bản
  • Phương pháp TFIDF
  • Phân loại văn bản: Topic modeling & Sentiment analysis
  • Machine Learning trên dữ liệu lớn (Big-data)
  • Giới thiệu về Neural Network và Deep Learning