Networks Business Online Việt Nam & International VH2

Khóa Học Data Science Khóa Học Tự Nhiên, Trung Tâm Tin Học Đại Học Khoa Học Tự Nhiên

Đăng ngày 18 August, 2022 bởi admin

Khóa Học Data Science Khóa Học Tự Nhiên, Trung Tâm Tin Học Đại Học Khoa Học Tự Nhiên

Mặc dù không có gì thực sự biến hóa nhưng những ngày đầu năm mới luôn mang đến cho tất cả chúng ta nhiều kỳ vọng với nhiều thứ mới mẻ và lạ mắt hơn. Nếu bạn thêm một kế hoạch, một số ít tiềm năng rõ ràng và lộ trình học tập, bạn sẽ có một công thức tuyệt vời cho một năm đầy nguồn năng lượng .
Đang xem : Khóa học data science khóa học tự nhiên
Bài đăng này nhằm mục đích phân phối cho bạn thông tin, tài nguyên và ý tưởng sáng tạo để giúp bạn kiến thiết xây dựng một hạng mục học tập hoặc cải tổ kỹ năng và kiến thức trình độ của bạn trong khoa học dữ liệu .

Lưu ý: Lộ trình này dựa trên kinh nghiệm cá nhân của Harshit Tyagi, hiện đang Web và Data Science Consultant, về khoa học dữ liệu. Đây không phải là kế hoạch học tập tất cả và cuối cùng. Bạn có thể điều chỉnh lộ trình này để phù hợp hơn với bất kỳ lĩnh vực hoặc lĩnh vực nghiên cứu cụ thể nào mà bạn quan tâm. Ngoài ra, tác giả đề cập nhiều đến Python vì cá nhân anh thích nó hơn các ngôn ngữ lập trình khác.

Nội dung
1. Học về lập trình hoặc kỹ thuật lập trình2. Học về tích lũy và sắp xếp tài liệu ( Data Collection và Wrangling ) 3. Học về Exploratory Data Analysis, Business Acumen, Storytelling4. Tìm hiểu về Kỹ thuật Dữ liệu5. Học về thống kê ứng dụng và toán học6. Học về Machine Learning và AI

Lộ trình học tập là gì?

Lộ trình học tập là một map kỹ năng và kiến thức với nhiều Lever, nhiều chi tiết cụ thể về những kiến thức và kỹ năng bạn muốn trau dồi, cách bạn giám sát tác dụng ở mỗi Lever và những kỹ thuật để thành thạo hơn nữa từng kỹ năng và kiến thức .
Trong lộ trình này bạn sẽ thấy trọng số cho từng Lever dựa trên mức độ phức tạp và tính thông dụng của ứng dụng trong quốc tế thực. Bạn cũng tìm thấy thời hạn ước tính cho người mới khởi đầu để triển khai xong mỗi Lever với những bài tập và dự án Bất Động Sản .
Dưới đây là kim tự tháp diễn đạt những kiến thức và kỹ năng cấp cao theo thứ tự phức tạp và ứng dụng của chúng trong ngành .

*
Lộ trình học data science theo thứ tự từ đơn thuần đến phức tạp .

Mô hình trên là một cơ sở khuôn khổ mà tất cả chúng ta sẽ dựa vào đó để thiết lập lộ trình học tập cho mình. Chúng ta sẽ đi sâu vào từng tầng với những chi tiết cụ thể đơn cử hơn, hoàn toàn có thể thống kê giám sát được. Trong đó có đề cập đơn cử đến việc kiểm tra những kiến thức và kỹ năng quan trọng và những nguồn lực thiết yếu để nắm vững những chủ đề đó .
Bạn hoàn toàn có thể đo lường và thống kê kiến thức và kỹ năng thu được bằng cách vận dụng những chủ đề đã học vào một số ít dự án Bất Động Sản trong quốc tế thực. Bạn hoàn toàn có thể tìm thấy một số ít sáng tạo độc đáo dự án Bất Động Sản, cổng thông tin và nền tảng hoàn toàn có thể sử dụng để giám sát mức độ thành thạo của mình .

1. Học về lập trình hoặc kỹ thuật lập trình

Ước tính thời gian cần: 2 – 3 tháng

Đầu tiên, hãy bảo vệ rằng bạn có kỹ năng và kiến thức lập trình. Mọi việc làm tương quan đến khoa học dữ liệu đều nhu yếu kỹ năng và kiến thức về lập trình trong tối thiểu một ngôn từ .

Các chủ đề lập trình cụ thể cần biết

Cấu trúc tài liệu phổ cập ( data types, lists, dictionaries, sets, tuples ), viết hàm, logic, luồng điều khiển và tinh chỉnh, thuật toán tìm kiếm và sắp xếp, lập trình hướng đối tượng người tiêu dùng và thao tác với thư viện bên ngoài. Tập lệnh SQL : Truy vấn cơ sở tài liệu bằng cách sử dụng những phép nối, tổng hợp và truy vấn con ( joins, aggregations, and sub-queries ) Sử dụng tốt Terminal, công cụ trấn áp phiên bản trong Git và sử dụng GitHub

Các nguồn tài liệu và khóa học về Python

Tài liệu học về Git và GitHub

Tài liệu học SQL

Kiểm tra kiến thức

Bạn hoàn toàn có thể kiểm tra kiến thức và kỹ năng trình độ của mình bằng cách xử lý nhiều yếu tố và thiết kế xây dựng tối thiểu 2 dự án Bất Động Sản :
Trích xuất tài liệu từ website / API endpoints – nỗ lực viết tập lệnh Python trích xuất tài liệu từ những website được cho phép trích xuất như soundcloud.com. Lưu trữ tài liệu được trích xuất vào tệp CSV hoặc cơ sở tài liệu SQL. Viết những game show như oẳn tù tì, kéo sợi, treo cổ, mô phỏng lăn xúc xắc, tic-tac-toe, v.v. Viết những ứng dụng web đơn thuần như trình tải xuống video YouTube, trình chặn website, trình phát nhạc, trình kiểm tra đạo văn, v.v.
Triển khai những dự án Bất Động Sản này trên những trang GitHub hoặc chỉ cần tàng trữ mã trên GitHub để bạn học cách sử dụng Git .

2. Học về thu thập và sắp xếp dữ liệu (Data Collection & Wrangling)

Ước tính thời gian cần: 2 tháng

Một phần quan trọng của việc làm khoa học dữ liệu là tập trung chuyên sâu vào việc tìm kiếm tài liệu tương thích hoàn toàn có thể giúp bạn xử lý yếu tố của mình. Bạn hoàn toàn có thể thu thập dữ liệu từ những nguồn hợp pháp khác nhau – cóp nhặt ( nếu website được cho phép ), API, Cơ sở tài liệu và những kho tàng trữ có sẵn công khai minh bạch. Sau khi bạn có tài liệu trong tay, nhà nghiên cứu và phân tích thường sẽ tự tìm cách làm sạch những tập dữ liệu ( dataframes ), thao tác với những mảng đa chiều, sử dụng giám sát diễn đạt / khoa học và thao tác với dataframes để tổng hợp tài liệu. Dữ liệu hiếm khi sạch và được định dạng để sử dụng trong “ quốc tế thực ”. Pandas và NumPy là hai thư viện được cho phép bạn chuyển từ tài liệu bẩn sang tài liệu chuẩn bị sẵn sàng nghiên cứu và phân tích. Khi bạn mở màn cảm thấy tự do khi viết những chương trình Python, hãy mở màn tham gia những bài học kinh nghiệm về cách sử dụng những thư viện như panda và numpy .

Các tài liệu và khóa học về tập hợp và làm sạch dữ liệu

Ý tưởng về dự án thu thập dữ liệu:

Chọn bất kể tập dữ liệu nào có sẵn công khai minh bạch và xác lập một bộ câu hỏi mà bạn muốn theo đuổi sau khi xem tập dữ liệu và domain. Thu thập dữ liệu để tìm ra câu vấn đáp cho những câu hỏi đó bằng cách sử dụng Pandas và NumPy .

3. Học về Exploratory Data Analysis, Business Acumen, Storytelling

Ước tính thời gian cần: 2-3 tháng

Một số thuật ngữ

Business Acumen : Nhạy bén kinh doanhData Storytelling : Kể chuyện bằng tài liệu

Giai đoạn tiếp theo cần nắm vững là phân tích dữ liệu và kể chuyện. Rút ra thông tin chi tiết từ dữ liệu và sau đó truyền đạt thông tin tương tự bằng các thuật ngữ và hình ảnh hóa đơn giản là trách nhiệm cốt lõi của Nhà phân tích dữ liệu.

Phần kể chuyện yên cầu bạn phải thành thạo với việc trực quan hóa dữ liệu cùng với kỹ năng và kiến thức tiếp xúc tốt .

Các chủ đề về phân tích dữ liệu thăm dò và dữ liệu kể chuyện

Phân tích dữ liệu thăm dò (Exploratory data analysis) : xác định câu hỏi, xử lý các giá trị bị thiếu, giá trị ngoại lai, định dạng, lọc, phân tích đơn biến và đa biến.Trực quan hóa dữ liệu (Data visualization): vẽ dữ liệu bằng các thư viện như matplotlib, seaborn và plotly. Biết cách chọn biểu đồ phù hợp để truyền đạt kết quả từ dữ liệu.

Xem thêm : Toán Lớp 5 Diện Tích Hình Tròn Trang 100, Toán Lớp 5 Trang 99, 100 : Diện Tích Hình Tròn

Phát triển bảng điều khiển (dashboards ): phần lớn các nhà phân tích chỉ sử dụng Excel hoặc một công cụ chuyên dụng như Power BI và Tableau để xây dựng dashboard tóm tắt và tổng hợp dữ liệu nhằm giúp các nhà quản lý đưa ra quyết định.Nhạy bén kinh doanh (Business acumen): đưa ra những câu hỏi phù hợp, những câu hỏi thực sự nhắm mục tiêu đến các chỉ số kinh doanh. Thực hành viết báo cáo, blog và trình bày rõ ràng và ngắn gọn.

Tài liệu và khóa học về phân tích dữ liệu

Ý tưởng dự án phân tích dữ liệu

Phân tích mày mò trên tập dữ liệu điện ảnh để tìm công thức tạo phim có doanh thu ( sử dụng nó làm nguồn cảm hứng ), sử dụng tập dữ liệu từ y tế, kinh tế tài chính, WHO, tìm hiểu dân số trước đây, Thương mại điện tử, v.v.

4. Tìm hiểu về Kỹ thuật Dữ liệu

Ước tính thời gian cần: 4-5 tháng

Kỹ thuật tài liệu tương hỗ những nhóm R&D bằng cách phân phối tài liệu sạch cho những kỹ sư điều tra và nghiên cứu và nhà khoa học tại những công ty dựa trên tài liệu lớn. Bản thân nó là một nghành nghề dịch vụ và bạn hoàn toàn có thể quyết định hành động bỏ lỡ phần này nếu bạn muốn chỉ tập trung chuyên sâu vào góc nhìn thuật toán thống kê của những yếu tố .
Các nghĩa vụ và trách nhiệm của một kỹ sư tài liệu gồm có kiến thiết xây dựng một kiến trúc tài liệu hiệu suất cao, hợp lý hóa việc giải quyết và xử lý tài liệu và duy trì những mạng lưới hệ thống tài liệu quy mô lớn .

Các kỹ sư sử dụng Shell (CLI), SQL và Python / Scala để tạo ETL pipelines, tự động hóa các tác vụ hệ thống tệp và tối ưu hóa các hoạt động cơ sở dữ liệu để làm cho chúng có hiệu suất cao.

Một kỹ năng và kiến thức quan trọng khác là tiến hành những kiến trúc tài liệu này yên cầu sự thành thạo về những nhà sản xuất dịch vụ đám mây như AWS, Google Cloud Platform, Microsoft Azure, v.v.

Tài liệu để học Kỹ thuật dữ liệu

Ý tưởng dự án và chứng chỉ

5. Học về thống kê ứng dụng và toán học

Ước tính thời gian cần: 4-5 tháng

Phương pháp thống kê là một phần TT của khoa học dữ liệu. Hầu hết toàn bộ những cuộc phỏng vấn khoa học dữ liệu đa phần tập trung chuyên sâu vào thống kê miêu tả và suy luận .
Đa phần mọi người thường mở màn viết code về những giải thuật machine learning mà không hiểu rõ về những giải pháp thống kê và toán học cơ bản lý giải hoạt động giải trí của những thuật toán đó. Tất nhiên, đây không phải là điều nên khuyến khích .

Các chủ đề chính về Thống kê ứng dụng (Applied Statistics) và toán học

Thống kê mô tả (Descriptive Statistics) – Tìm hiểu về các ước tính của vị trí (trung bình, trung vị, chế độ, thống kê có trọng số, thống kê được cắt bớt) và khả năng thay đổi để mô tả dữ liệu.Thống kê tham chiếu (Inferential statistics) – thiết kế kiểm tra giả thuyết, kiểm tra A / B, xác định số liệu kinh doanh, phân tích dữ liệu thu thập và kết quả thử nghiệm bằng cách sử dụng khoảng tin cậy, giá trị p và giá trị alpha.Đại số tuyến tính, phép tính đơn và đa biến (Linear Algebra, Single and multi-variate calculus) để hiểu các hàm mất mát, gradient và các trình tối ưu hóa trong học máy.

Tài liệu và khóa học về thống kê và toán

Ý tưởng dự án về thống kê

Giải những bài tập được phân phối trong những khóa học ở trên và sau đó thử xem qua một số ít bộ tài liệu công khai minh bạch nơi bạn hoàn toàn có thể vận dụng những khái niệm thống kê này. Đặt những câu hỏi như “ Có đủ dẫn chứng để Kết luận rằng tuổi trung bình của những bà mẹ sinh con ở Boston là trên 25 tuổi với mức ý nghĩa 0,05 ” không ? Cố gắng phong cách thiết kế và chạy những thử nghiệm nhỏ với những đồng nghiệp / nhóm / lớp của bạn bằng cách nhu yếu họ tương tác với một ứng dụng hoặc vấn đáp một câu hỏi. Chạy những giải pháp thống kê trên tài liệu đã tích lũy khi bạn có một lượng tài liệu tốt sau một khoảng chừng thời hạn. Điều này hoàn toàn có thể rất khó để triển khai nhưng sẽ rất mê hoặc. Phân tích giá CP, tiền điện tử và phong cách thiết kế giả thuyết xung quanh doanh thu trung bình hoặc bất kể số liệu nào khác. Xác định xem bạn hoàn toàn có thể bác bỏ giả thuyết vô hiệu hay không bằng cách sử dụng những giá trị quan trọng .

6. Học về Machine Learning và AI

Ước tính thời gian cần: 4-5 tháng

Sau khi tự khám phá và xem qua tổng thể những khái niệm chính nói trên, giờ đây bạn nên sẵn sàng chuẩn bị để mở màn với những thuật toán Machine Learning ưa thích .
Có ba kiểu học chính :

Học có giám sát (Supervised Learning ) – bao gồm các bài toán hồi quy và phân loại. Nghiên cứu hồi quy tuyến tính đơn giản, hồi quy bội, hồi quy đa thức, thuật toán Naive Bayes, hồi quy logistic, KNNs, mô hình cây, mô hình tổng hợp. Tìm hiểu về các chỉ số đánh giá.Học không giám sát (Unsupervised Learning )Phân cụm (Clustering) và giảm chiều dữ liệu ( dimensionality reduction) là hai ứng dụng được sử dụng rộng rãi của học không giám sát. Đi sâu vào PCA (Principal component Analysis), phân cụm K-mean, tạo cây phân cấp (hierarchical clustering) và mô hình gaussian hỗn hợp (gaussian mixtures).Học tập tăng cường (Reinforcement learning) – giúp bạn xây dựng hệ thống tự thưởng. Tìm hiểu cách tối ưu hóa phần thưởng, sử dụng thư viện TF-Agents, mô hình Deep Q-networks, v.v. Tuy nhiên bạn có thể bỏ qua phần này.

Tài liệu học về Machine Learning

Theo dõi tiến độ học tập

Bạn hoàn toàn có thể sử dụng công cụ theo dõi học tập trên Notion được tạo sẵn ở đây. Bạn hoàn toàn có thể tùy chỉnh nó theo nhu yếu của mình và sử dụng nó để theo dõi tiến trình của mình, thuận tiện truy vấn vào tổng thể những tài nguyên và dự án Bất Động Sản của bạn .
Xem thêm : Câu 1, 2, 3 Trang 83 Vở Bài Tập Toán Lớp 4 Trang 83 Tập 1, Vở Bài Tập Toán 4 Trang 83
Trên đây chỉ là tổng quan về phổ rộng của khoa học dữ liệu. Bạn hoàn toàn có thể đi sâu vào từng chủ đề này và tạo kế hoạch cho riêng mình dựa trên khái niệm trong từng hạng mục .

Bạn có thể xem bài gốc của Harshit Tyagi tại đây

Bạn có biết ?
tham gia hội đồng lingocard.vn trên Linkedin, Facebook và những kênh mạng xã hội khác hoàn toàn có thể giúp bạn nhanh gọn tìm được những chủ đề tăng trưởng nghề nghiệp và update thông tin về việc làm IT mới nhất Linkedin Page : https://bit.ly/Linkedinlingocard.vn Facebook Group : https://bit.ly/lingocard.vnvn thời cơ việc làm IT : lingocard.vn

Xem thêm bài viết thuộc chuyên mục: Khóa học

Điều hướng bài viết

Source: https://vh2.com.vn
Category : Khoa Học

Liên kết:XSTD