Học big data | Làm Quen với Pandas và DataFrame | Tự Học Data Science #1

by admin97 | @ | Tháng sáu 29, 2021 8:34 chiều

Học big data đang là chủ đề được rất nhiều người tìm kiếm. Vậy nên hôm nay Điểm Tốt xin đưa đến các bạn chủ đề Học big data | Làm Quen với Pandas và DataFrame | Tự Học Data Science #1 thông qua video và nội dung dưới đây:

Mua khóa học này trên Unica: Mua Ngay

Mua khóa học này trên Kyna: Mua Ngay

Hello Diu Túp, hôm nay chúng mình xin giới thiệu đến các bạn Series “Tự Học Data Science Cho Người Mới Bắt Đầu”. Và chủ đề của Video hôm này là “Làm Quen vs Pandas và DataFrame” 🤩 !

Link Download Dataset trong Video:

Data Science (hay còn gọi là Khoa học dữ liệu) trở thành một trong những ngành có nhu cầu nhân lực cao nhất ở thế kỷ 21. Thuật ngữ “Data Science” cũng là thuật ngữ được nhiều người nhắc đến hằng ngày. Data Science được định nghĩa là tất cả những gì về thu thập, khai thác và phân tích dữ liệu để tìm ra insight giá trị. Sau đó trực quan hóa các Insight cho các bên liên quan, để chuyển hóa Insight thành hành động. Đây là lĩnh vực đa ngành sử dụng các phương pháp và quy trình khoa học để rút ra insight từ dữ liệu.

Pandas là là thư viện mã nguồn mở với hiệu năng cao cho phân tích dữ liệu trong Python được phát triển bởi Wes McKinney trong năm 2008. Chỉ với hơn 1 năm phát triển nó đã trở thành một thư viện chuẩn cho việc phân tích dữ liệu khi dùng Python. Pandas là một thư viện mã nguồn mở được xây dựng dựa trên NumPy, sử dụng thao tác và phân tích dữ liệu, được thiết kế để cho phép bạn làm việc với dữ liệu được gắn nhãn hoặc quan hệ theo cách trực quan hơn

– Có thể xử lý tập dữ liệu khác nhau về định dạng: chuỗi thời gian, bảng không đồng nhất, ma trận dữ liệu
– Khả năng import dữ liệu từ nhiều nguồn khác nhau như CSV, DB/SQL
– Có thể xử lý vô số phép toán cho tập dữ liệu: subsetting, slicing, filtering, merging, groupBy, re-ordering, and re-shaping,..
– Xử lý dữ liệu mất mát theo ý người dùng mong muốn: bỏ qua hoặc chuyển sang 0
– Xử lý, phân tích dữ liệu tốt như mô hình hoá và thống kê
– Tích hợp tốt với các thư viện khác của python
– Cung cấp hiệu suất tốt

[0:00] Giới thiệu về Data Science
[1:30] Giới thiệu về CodeXplore Github Repo
Link:
[3:10] Hướng dẫn cài đặt và sử dụng Anaconda
Link:
[4:35] Hướng dẫn sử dụng Jupyter Notebook
[8:00] pd.read_csv()
[10:15] df.shape
[11:10] df.info()
[12:35] df.columns
[13:15] df.index
[14:00] df.describe()
[16:38] .loc()
[22:45] .iloc()
[26:59] .dtype
[28:14] .apply()
[32:50] Nhân các column trong Data Frame và tạo Column mới
[36:36] .groupby()
[38:59] .sort_values()
[40:45] .value_count()
[41:39] .nuique()

Full Series “Tự Học Data Science Cho Người Mới Bắt Đầu”:

Group Hỏi Đáp:

————- ✪ About CodeXplore Channel ✪ ————
CodeXplore là một platform chia sẻ kiến thức về Lập Trình [Coding] dành cho các bạn trẻ Việt Nam từ một cựu du học sinh Sing, hiện đang sống và làm việc tại Singapore.

Channel của mình sẽ focus vào các chủ đề sau:
► [Code] Lập Trình Web – Full-Stack (HTML, CSS, JavaScript, Node JS và React JS) ☞ Future Projects: Deno
► [Code] Interview Preparation (Cấu Trúc Dữ Liệu và Thuật Toán & LeetCode Solutions)
► [Code] Lập Trình Python (Cơ Bản, Lập Trình Hướng Đối Tượng, Lập Trình Game)

► [Xplore] Travel Vlog (Chia sẻ kinh nghiệm đi du lịch và trải nghiệm)
——————
✪ Business inquiries: [email protected]
✪ Subscribe:

➥ CodeXplore Social Links:
Fanpage:
Instagram:
GitHub:

#JupyterNotebook #Pandas #DataScience

Tag: Học big data, CodeXplore, lap trinh, lap, trinh, python, PYTHON, python3, tự học, lập trình, lập, trình, cơ bản, AI, code, co ban, data science, pandas, data frame, DataFrame, Jupyter, notebook, tự học data science, data science cơ bản, cài đặt anaconda, machine learning, trí tuệ nhân tạo, máy học, trí, tuệ, nhân, tạo, ai, học pandas, pandas là gì, tự học pandas, pandas python, Pandas Library, python pandas

Cảm ơn các bạn đã theo dõi chủ đề Học big data | Làm Quen với Pandas và DataFrame | Tự Học Data Science #1. Điểm Tốt hy vọng đã giúp được bạn giải đáp được vấn đề, mọi thắc mắc hay bình luận xuống phía dưới.

Xem thêm: https://tieudiemtuong.net/category/bai-tap

41 Comments

CodeXplore Tháng sáu 29, 2021 at 8:34 chiều · Edit

Hi mọi người, mình Pin comment các cách để tải Dataset xuống nhé:

Cách 1: Các bạn Click vào đường link này: https://github.com/CodexploreRepo/data_science/blob/main/Code/A2_Pandas/P1_Getting_Knowing_Data/chipotle.tsv
Rồi bấm nút "raw" => và Lưu Xuống bằng cách > Click chuột phải vào link này rồi chọn "Save Link As"

Cách 2: Clone toàn bô Repo "Data Science" @ https://github.com/CodexploreRepo/data_science xuống máy tính của các bạn, Dataset sẽ nằm tại Folder: Code/A2_Pandas/P1_Getting_Knowing_Data/
Reply
Hiếu Nguyễn Văn Tháng sáu 29, 2021 at 8:34 chiều · Edit

Ui đúng lúc em đang định học về data science mà khóa nào trên udemy cũng đắt :(( thanks anh nhaa
Reply
R.I.P Facebook Tháng sáu 29, 2021 at 8:34 chiều · Edit

it is very interesting, can you make some tutorial videos relating to financial library ^^ thanks
Reply
Otis IT Tháng sáu 29, 2021 at 8:34 chiều · Edit

Dạ anh ơi, tại sao tổng số lượng ordered Chicken Bowl ở 2 phương pháp (Groupby – 761 và value_count – 726) là khác nhau vậy ạ? Thế thì với value_count, phương thức này đã bỏ qua những trường hợp nào thế anh? Cảm ơn anh nhiều ạ – bài giảng của anh rất hay <3.
Reply
Quân Lê Tháng sáu 29, 2021 at 8:34 chiều · Edit

Chào anh ạ, em là sinh viên chuyên ngành toán học mong muốn tìm hiểu thêm về data-scientist và machine-learning không biết là bắt đầu từ đâu ạ. Em cảm ơn rất nhiều!!!
Video rất hay ạ!
Reply
Nguyen Annie Tháng sáu 29, 2021 at 8:34 chiều · Edit

Hay quá a ơi, mong a làm thêm nhiều video về Data Science nữa ạ! Chúc a nhiều sức khoẻ
Reply
Hà Nguyễn Quang Tháng sáu 29, 2021 at 8:34 chiều · Edit

hay quá anh ơi, em trông chờ vào những video tiếp theo của anh. Hy vọng kênh của anh sẽ được phổ biến rộng rãi hơn vì độ chất lượng của nó <3
Reply
Trần Quốc Hoài (bsquochoai) new Tháng sáu 29, 2021 at 8:34 chiều · Edit

cảm ơn anh ạ
Reply
Nguyễn Huy Tháng sáu 29, 2021 at 8:34 chiều · Edit

Cool. Hy vọng anh ra nhìu video mớiii
Reply
Uyên Trần Tháng sáu 29, 2021 at 8:34 chiều · Edit

rất hữu ích cho những bạn entry như em anh ơi <333 cảm ơn anh rất nhiều và hóng những video chất lượng tiếp theo từ anh
Reply
Thuỳ Linh Nguyễn Tháng sáu 29, 2021 at 8:34 chiều · Edit

Cho em hỏi khi em đọc file thì xuất hiện lỗi này, em kiểm tra lại đã download và lưu đúng tên file mà không được ạ
NameError Traceback (most recent call last)

<ipython-input-1-a29405eb924b> in <module>

—-> 1 df.head(5)

NameError: name 'df' is not defined
Reply
UYEN PHAN Tháng sáu 29, 2021 at 8:34 chiều · Edit

Rất vui vì đã có một channel tiếng Việt về Data Science được thực hiện bài bản và chỉn chu. Cám ơn anh.
Reply
Liên Minh 360 Tháng sáu 29, 2021 at 8:34 chiều · Edit

anh ra tiếp đi a <3. a dạy có tam thật sự #<3
Reply
Nguyễn Trần Quang Hải Tháng sáu 29, 2021 at 8:34 chiều · Edit

sao trong phần số lượng item ở hàm groupby và hàm value_counts khác nhau vậy ad
Reply
Bo Huynh Tháng sáu 29, 2021 at 8:34 chiều · Edit

nghe giọng ông truyền đạt thật sự mà thề nghe ghiền thật sự
Reply
Công Vinh Trần Tháng sáu 29, 2021 at 8:34 chiều · Edit

cho em xin video về giải thích phần apply(lambda.. được ko anh.
Reply
Khoa Nguyễn Đăng Tháng sáu 29, 2021 at 8:34 chiều · Edit

ra thêm video đi ông ơi. rất rất cần các hướng dẫn bằng tiếng việt cho beginner như thế này <3
Reply
Vi Vi Tháng sáu 29, 2021 at 8:34 chiều · Edit

Cảm ơn anh, video hướng dẫn rất chi tiết và dễ hiểu!
Reply
Ngọc Đặng Đình Tháng sáu 29, 2021 at 8:34 chiều · Edit

đang tự châm cứu món này vô tình tìm dược channel của bác, công nhận là bác này mọi thứ đều rất trau chuốt , amazing good jobs bro !
Reply
Hùng Nguyễn Duy Tháng sáu 29, 2021 at 8:34 chiều · Edit

Anh ơi cấu hình về cấu hình laptop tốt để có thể dùng theo ngành này tối thiểu là ntn ạ 🙁 em tìm mà thấy ngta nói lan man quá ạ
Reply
Nguyễn Quang Đạo Tháng sáu 29, 2021 at 8:34 chiều · Edit

Hay quá. Good chóp 😅
Reply
Vũ Lê Minh Tháng sáu 29, 2021 at 8:34 chiều · Edit

Tải file dataset kiểu gì vậy mọi người
Reply
Misa Tran Tháng sáu 29, 2021 at 8:34 chiều · Edit

Anh ơi, anh chỉ giúp em phím tắt để thụt lề hàng loạt dòng trong Jupyter với ạ
Em kiếm google mà ko thấy nơi :((
Reply
Tinh Van Tháng sáu 29, 2021 at 8:34 chiều · Edit

Rất Hay. Cảm ơn bạn
Reply
Vinh Lê Tháng sáu 29, 2021 at 8:34 chiều · Edit

em thấy kênh rất hay nhưng ý kiến riêng của em để kênh tốt hơn và chuyên nghiệp hơn
quan trọng nhất là anh nên đầu tư cái mic xịn khử noise đi nghe nó sẽ ổn hơn
Reply
Nampy Tháng sáu 29, 2021 at 8:34 chiều · Edit

Chat luong qua anh, mong anh ra video nhieu nua
Reply
Nguyen Hoang Tháng sáu 29, 2021 at 8:34 chiều · Edit

cuối cùng cũng ko phải dọc vietsub nữa thanks mn rất nhiều :))
Reply
Tran Xuan Linh Tháng sáu 29, 2021 at 8:34 chiều · Edit

hay quá anh ơi. Cảm ơn anh nhé
Reply
Hiep le Tháng sáu 29, 2021 at 8:34 chiều · Edit

video phù hợp cho những bạn đã biết chút chút python
cảm ơn nhiều
Reply
Phát Nguyễn Tháng sáu 29, 2021 at 8:34 chiều · Edit

Hay quá, ra thêm nữa đi anh ơiiiiiii
Reply
Quang Trần Tháng sáu 29, 2021 at 8:34 chiều · Edit

Ra video nữa đi anh 🙂 bình thường mình toàn dùng excel, power BI, giờ muốn học py để phân tích dữ liệu.
Reply
Duy Vo Tháng sáu 29, 2021 at 8:34 chiều · Edit

hay quá. ra tiếp video ad ơi.
Reply
Lưu Tùng LINH Tháng sáu 29, 2021 at 8:34 chiều · Edit

anh ơi anh có dạy về datamining ko anh, em thấy data mining cũng là 1 phần của data SCience
Reply
Black Net Tháng sáu 29, 2021 at 8:34 chiều · Edit

Mong có nhiều video như vậy hơn quá cuốn
Reply
Nam Tháng sáu 29, 2021 at 8:34 chiều · Edit

Mấy cái này mà data science gì bay???
Reply
Hưng Nguyễn Tháng sáu 29, 2021 at 8:34 chiều · Edit

mau ra tiếp series này đi a ơi, hay quá ạ đã đăng ký và like luôn rồi hehe
Reply
Diệp Phi Lê Tháng sáu 29, 2021 at 8:34 chiều · Edit

Cám ơn bạn đã ra những video này nó rất bổ ích và đầy đủ hơn các channel khác. Hy vọng bạn ko drop cái series này nhé <3
Reply
Dung Pham Anh Tháng sáu 29, 2021 at 8:34 chiều · Edit

Chất lượng quá anh ơi, thêm video nữa nha
Reply
Đức Nguyễn Tháng sáu 29, 2021 at 8:34 chiều · Edit

anh ơi, e tải cái file thực hành về nhưng nó khác của anh ạ, nó ra hoàn cái linnk gì không à
Reply
DatIT Tháng sáu 29, 2021 at 8:34 chiều · Edit

Hay! Mình đã đăng kí cho bạn, chúc bạn một ngày tốt lành 😍
Reply
XL Tháng sáu 29, 2021 at 8:34 chiều · Edit

cảm ơn bạn!
Mình muốn tìm hướng dẫn sử dụng hàm if trong pandas giống như hàm if trong excel thì tìm ở đâu nhỉ. Hy vọng series này bạn đề cập đến vấn đề này.
Reply

Học big data | Làm Quen với Pandas và DataFrame | Tự Học Data Science #1

Related Posts

Cách sắp xếp thứ tự xuất hiện trong PowerPoint chỉ trong 60 giây

Một số mẹo nhỏ trong cách trình chiếu PowerPoint bạn nên bỏ túi

Cách chuyển file PowerPoint sang Word trong “tích tắc”

41 Comments

Leave a Reply Hủy