Trực quan hoá dữ liệu (Data Visualization)

5/5 - (2 bình chọn)

I. Giới thiệu

Khoá học Beginner 3 là khoá học thứ 3 trong 11 khoá học thuộc chương trình đào tạo “Khoa học dữ liệu” của DevUp. Trong khoá học này học viên sẽ được học cách đọc và xử lí các loại dữ liệu căn bản như dữ liệu chữ, dữ liệu hình ảnh, dữ liệu âm thanh, dữ liệu dạng bảng,..Khóa học này còn cung cấp cho học viên phương pháp thu thập dữ liệu trên internet để phục vụ cho mục đích yêu cầu của dự án hoặc bổ sung cho dữ liệu sẵn có để cải thiện sự hiệu quả cũng như độ tin cậy của mô hình máy học. Học viên sẽ được học cách phân tích dữ liệu thăm dò sử dụng trực quan hóa dữ liệu, biết sử dụng đúng loại biểu đồ và trình bày một cách hợp lí để tìm hiểu mối tương quan giữ các biến số trong tập dữ liệu. Học viên còn được học những phương pháp thăm dò dữ liệu để hiểu được đặc trưng và có cái nhìn tổng quát về bộ dữ liệu, tình trạng của từng biến; qua đó giúp hình thành được phương án tiếp cận phù hợp cho việc xử lý cũng như xây dựng mô hình. Các phương pháp tiền xử lí dữ liệu hay làm sạch dữ liệu, chuẩn hóa, và biến đổi các biến số cũng sẽ được truyền đạt trong nội dung của khóa học. Sau khi kết thúc khóa học, học viên có thể nắm được toàn bộ quy trình chuẩn bị dữ liệu tốt cho các mô hình máy học để có thể đáp ứng được yêu cầu của bài toán thực tế cũng như của doanh nghiệp.

II. Thời lượng đào tạo

  1. Tổng thời gian đào: 45 giờ
  1. Thời gian nghe giảng: 14 giờ (14 buổi, mỗi buổi 1 giờ)
  1. Thời lượng thực hành: 21 giờ (mỗi buổi thực hành 1.5 giờ)
  1. Thời lượng trao đổi Q&A: 7 giờ (sau mỗi buổi học 0.5 giờ)
  1. Kiểm tra, đánh giá: 3 giờ
  2. Thời lượng dự án / tự học: 45 giờ

III. Điều kiện tiên quyết

  1. Học viên đã tốt nghiệp THCS / THPT
  1. Học viên đã làm quen và có thể sử dụng máy tính
  1. Học viên có kết nối Internet và các thiết bị cần thiết cho việc nghe giảng và thực hành
  1. Kỹ năng Tiếng Anh: có thể đọc được tài liệu/website về CNTT bằng tiếng Anh (có hoặc không có sự hướng dẫn của giảng viên); có thể giao tiếp cơ bản bằng tiếng Anh (nghe).
  1. Kỹ năng lập trình: Kỹ năng cơ bản về một ngôn ngữ lập trình, ưu tiên Python
  1. Có kỹ năng cơ bản về sử dụng hệ điều hành Ubuntu, cài đặt các thư viện phần mềm trên Ubuntu
  1. Khoá học bắt buộc: Tổng quan về AI và Khoa học dữ liệu

Chương 1: Ôn tập kĩ năng cơ bản trong lập trình bằng python

1
Các kĩ năng cơ bản trong Python
28
2
Độ phức tạp trong Python
18
3
Bài tập thực hành
3

Chương 2: Các loại dữ liệu

1
Giới thiệu về các loại dữ liệu căn bản
19
2
Xử lí văn bản dữ liệu chữ
30
3
Thực hành
24
4
Xử lí dữ liệu hình ảnh
26
5
Thực hành
22
6
Xử lí dữ liệu bảng
24
7
Thực hành
21
8
Xử lí dữ liệu âm thanh
29
9
Thực hành
24
10
Xử lí dữ liệu video
16
11
Thực hành
22

Chương 3: Thu thập dữ liệu qua Internet

1
Giới thiệu về thu nhập dữ liệu qua Internet
2
Thu nhập dữ liệu trong trang web tĩnh
3
Thu nhập dữ liệu trong trang web động
4
Các kĩ thuật xử lí nâng cao
5
Bài tập thực hành

Chương 4: Trực quan hóa dữ liệu

1
Giới thiệu trực quan hóa dữ liệu dữ liệu
13
2
Thực hành
4
3
Biểu đồ phân phối
9
4
Thực hành
18
5
Biểu đồ thể hiện quan hệ tương quan
8
6
Thực hành
8
7
Biểu đồ thứ hạng
8
8
Thực hành
11
9
Biểu đồ thành phần và Biểu đồ giao thoa
8
10
Thực hành
19
11
Biểu đồ chu kỳ và Timeseries
9
12
Thực hành
15
13
Biểu đồ không gian địa lý
11
14
Thực hành
40
15
Kỹ thuật để tạo nên một biểu đồ tốt trong trực quan hóa dữ liệu
14
16
Bài tập thực hành
5

Chương 5: Phân tích dữ liệu thăm dò

1
Giới thiệu về phân tích và thăm dò dữ liệu
2
Phương pháp phân tích dữ liệu thăm dò (EDA)
3
Kỹ thuật phân tích cụm
4
Phương pháp phân tích cụm theo khoảng cách giữa các điểm
5
Phương pháp phân tích cụm đặc biệt
6
Bài tập thực hành

Chương 6: Kỹ thuật tiền xử lý dữ liệu

1
Quy trình xử lý dữ liệu
10
2
Xử lý dữ liệu thô
12
3
Thực hành
25
4
Quy trình tiền xử lý dữ liệu
10
5
Xử lý dữ liệu khiếm khuyết
14
6
Thực hành
30
7
Xử lý dữ liệu có phương sai thấp và biến có hệ số tương quan cao
12
8
Bài tập thực hành
4

Chương 7: Máy học trong tiền xử lý dữ liệu

1
Ôn tập các kỹ thuật xử lý missing values
2
Phương pháp sử dụng mô hình máy học trong xử lý missing values
3
Phương pháp sử dụng thống kê trong xử lý missing values
4
Các mô hình có thể học với giá trị bị khiếm khuyết
5
Bài tập

Chương 8: Kỹ thuật chuẩn hóa và biến đổi dữ liệu

1
Giới thiệu về chuẩn hóa dữ liệu
2
Chuẩn hóa dữ liệu cho biến dự đoán
3
Chuẩn hóa dữ liệu cho biến phụ thuộc
4
Biến đổi dữ liệu
5
Phương pháp biến đổi dữ liệu
6
Mất cân bằng dữ liệu ở biến phụ thuộc

Project thực tế

1
Project giữa khóa
2
Project cuối khóa

Chúc mừng, bạn là người đầu tiên đánh giá cho khoá học!

Vui lòng đăng nhập để thực hiện đánh giá.
Yêu thích
Mua
Đã đăng ký: 1034 học sinh
Thời lượng: 2 tháng
Bài học: 62
Video: 60
Trình độ: Cơ bản