人生苦短,我用python(基礎篇)


1、python數據分析環境的搭建
Anaconda 和 Jupyter Notebook 已經成為數據分析的標準環境
- Anaconda : 包管理器和環境管理器
- Jupyter Notebook : 可以將數據分析需要的代碼、圖表、文字組合到一個web文檔中,形成數據分析報告

jupyter notebook 可以做哪些事情?
具體的操作可以參考猴子的兩篇文章,在此就不贅述了。
在環境搭建中可能遇到的問題:
1、jupyter notebook 沒有 conda 和 nbextensions 兩個標籤的重裝軟體。
先安裝nb_conda命令:
conda install nb_conda
再安裝nbextensions命令:
conda install -c conda-forge jupyter_contrib_nbextensions

2、快速學會 Python 的4個關鍵點
- 數據
- 條件判斷
- 循環
- 函數
2-1 數據
Q:什麼是變數?
A:在代碼中,我們用變數來存放數據,並用等號為變數賦值,變數可以存放任意數據類型的數據。為了方便使用變數,我們需要為變數取名。優秀的編程人員在給變數取名時,前半部分名稱要能代表數據的意義,後半部分名稱要能代表數據的類型。這樣當我們使用變數的時候,可以很方便地通過變數名知道這個變數中存放了什麼數據,而且還能根據這個變數名稱知道這個變數存放的數據是什麼類型。數字不能作為變數名稱的開頭,而且python是大小寫敏感的

Q:注釋怎麼表示?
A:
法1:#
# 中國首富馬雲namestr = 馬雲
法2: 或 """ """
中國首富馬雲,你咋這麼有錢namestr = 馬雲
1) 字元串(String)


2)數字(Number)

3)容器(存放多個數據)
① 列表(List) ② 元組(Tuple) ③ 集合(Sets) ④ 字典(Dictionary)
掌握容器的捷徑:1、如何定義容器? 2、容器的4個操作:增加,刪除,查詢,修改
① 列表
Q1:如何定義列表?


Q2:如何對列表進行增刪查改?




② 元組
元組的元素不能修改(增、刪、改),所以元組只能查詢


③ 集合
集合(Sets)是一個沒有重複元素的容器(無序)
在數據分析中,集合可以用來去除重複的數據,這一點很有用
Q1:如何定義集合?

Q2:如何對集合進行增刪查改?




④ 字典
鍵必須是唯一的,這樣是為了讓每一個鍵值對映射都唯一;鍵也必須是不可變的,所以可以用數字、字元串和元組來充當
Q1:如何定義字典?


Q2:如何對字典進行增刪查改?




4)布爾型(Bool)
Bool:True False 多用於條件判斷

5)空值型(None)

數據類型總結:字元串、數字、容器(列表、元組、集合、字典)、布爾、None
其中不可修改的數據類型為字元串、數字和元組
2-2 條件判斷







2-3 循環





2-4 函數

Q1:如何自定義函數?


Q2:如何使用函數?

函數參數:不可變數據類型

函數參數:可變數據類型

變數作用域:Python 變數的作用域一共有2種:全局作用域,局部作用域
定義在函數內部的變數擁有一個局部作用域,定義在函數外的變數擁有全局作用域。局部變數只能在其被聲明的函數內部訪問,而全局變數可以在整個程序範圍內訪問。


3、模塊
3-1 什麼是模塊

模塊即分類,每個模塊都有特定的功能,使用模塊就不需要從零開始造輪子了,最終都是為了提高寫代碼和維護代碼的效率
Python 中有內置的模塊,也有許多第三方的庫,引入模塊就可以使用模塊中的函數和屬性
3-2 如何使用 Python 內置模塊

3-3 如何使用第三方的包


3-4 包的組織結構
為了避免模塊名的衝突,Python 又引入了按目錄來組織模塊的方法,稱為包

3-5 模塊使用總結


4、數據結構
4-1 隊列(queue)
隊列就像你去餐廳外婆家吃飯排隊,新來的人在隊列尾部加入,叫做入隊;取完票的人從隊列首部離開隊列,叫做出隊
1)定義隊列

2)入隊

3)出隊

4-2 棧(stack)
棧這種數據結構有點像生活中的木桶。你往棧中加入新的元素,就是入棧,新的元素總是放在木桶的最上面。
1)定義棧

2)入棧

3)出棧

4-3 排序字典(OrderedDict)
1)定義排序字典

4-4 計數器(Counter)




5、總結:一句話記住知識點

推薦閱讀:
※一個不尷尬的茶會?或許可以用數據開啟
※如何快速入門數據分析
※數據之美
※關於Alternative Data的一些想法(1)
TAG:數據分析 |
