作者
CDA数据分析师
了解编程语言
正如人与人之间的沟通需要语言,人与计算机之间的沟通,也需要语言,连接人与计算机沟通的桥梁就是编程语言。任何编程语言只要用来开发程序,都怀揣着同一使命——“为人类干活”,将人类的需求“翻译”成计算机能看得懂的机器指令,让计算机代替人类去干活。
为什么选择python
Python可以说是编程语言中罕见的既简单又强大的一门语言,python语言简洁,语言优雅,功能强大,使用python,你只需要专注于问题的解决方案,而不是苦恼于编程语言的语法和结构。Python的发明者“GuidovanRossum”给python贴的标签是“简洁”和“优雅”,即对于编程语言的新手都能迅速上手使用python。下面总结了python语言的三大闪光点:
数据科学领域的主流语言随着大数据时代的来临,人们越来越意识到数据的重要性,数据分析师被称为二十一世纪最性感的职业。python紧挨着R语言,以短短几年时间迅速成为数据科学领域中编程语言的后起之秀,为该领域提供了大量功能强大的模块。拥有成熟的程序包资源库Python除了其自带的标准库外,还拥有大量的丰富且强大的第三方库,避免了一些“重复造轮子”的工作。PyPI是python官方的第三方库的仓库,拥有超过个python模块和脚本的资源库,堪称是python语言的“宝藏”。跨平台的先驱者python可以在Windows、Linux·、macOS众多不同平台使用,且其代码都是开源的,非常贴心。同时,python经过多个版本的修订及完善,其运行也非常稳定,能保证你的代码能畅快运行。
怎么学python
俗话说得好,“摩天大楼从地起”,学习任何编程语言都一定要把该语言的基础打牢,而怎么打地基呢?秘诀只有一条:多敲代码多敲代码多敲代码。学习前期建议找一本讲python基础的书或博客,把里面的例题跟着操作一遍,在基础打扎实后,可上一些比较出名的竞赛项目的网站如kaggle等,通过做项目去巩固知识。
推荐书籍:《Python基础教程(第3版)》MagnusLieHetland著
推荐理由:全面介绍了Python的基础知识、基本概念,高级主题,还有Python程序测试、打包、发布等知识,及10个具有实际意义的Python项目的开发过程,涉及的范围较广,既能为初学者夯实基础,又能帮助程序员提升技能,适合各个层次的Python开发人员阅读参考。
基础知识
代码规范
1.缩进
相比于其他语言用大括号和end来标识代码块,python语言比较“独特”,其通过代码的缩进来标识所属代码块,通常4个空格为一个缩进,可用tab键实现。缩进是python代码的重要组成部分,若你的代码缩进格式不正确,如同一段代码块语句缩进不一致,首句未顶格等,都会运行出错。
#一个完整的语句首句要顶格
i=0
#同一代码块的语句应缩进一致
foriinrange(5):
print(i)
i+=1
2.注释
编程语言的注释,即对代码的解释和说明。给代码加上注释,可提高代码的可读性,当你阅读一段他人写的代码时,通过注释迅速掌握代码的大致意思,读起代码将更加得心应手。
python语言的注释分为单行注释和多行注释,在注释符后的内容计算机会自动跳过不去执行。
单行注释:在需注释语句前加“#”,可在代码后使用,也可另起一行使用
i=1#在代码后使用注释
#另起一行使用注释
多行注释:在语句开头和结尾处加三个单引号或三个双引号(前后须一致)
使用单引号的多行注释
使用双引号的多行注释
使用注释除了起到望文生义,迅速了解代码意思的作用外,还有一个小妙处,可以将某段未完成或需要修改的代码隐蔽起来,暂时不让计算机执行。
3.多行语句
python中默认以行结束作为代码结束的标记,而有时候为了阅读方便,我们需要将一个完整代码跨行表示,这时候我们可以使用续行符:反斜杠“\”来将一行语句分为多行显示:
score=eng_score+\
math_score+\
his_score
注意:若语句中使用大括号{}、中括号[]或小括号()将数据括起来,则不需要使用续行符,如下所示:
name=[Ada,Ailsa,Amy,
Barbara,Betty,Blanche
Carina,Carrie,Carry
Daisy,Darcy,Diana]
什么是算法
在学习使用python之前,要先明确使用python的目的是什么?作为一名数据分析工作者,我们并不需要使用python语言来设计程序,只需要使用python来完成算法的实现。那么算法又是什么呢?
算法是指解决某项问题的流程或步骤,我们可以用一个很贴近生活的例子去理解,假如你需要做一道“西红柿炒鸡蛋”,根据菜谱:先准备食材,然后下油热锅,将西红柿倒进去翻炒后,加入蛋液翻炒至熟。
这就是我们完成“西红柿炒鸡蛋”这道菜所用的“算法”,而完成这个算法所需要的就是原料和操作说明,下面来看看原料和说明是什么。
变量
Python语言中的“原料”即对象,在python里万物皆对象,而对象通过引用变量唯一存在,引用上面的例子,可以将”鸡蛋”理解为”对象”,而给它取的名字”小红家鸡生的蛋”则是”变量”。
变量的概念想必大家不会陌生,和中学方程中学的变量基本上是一致的.变量可以理解为对事物的一个代号或者贴的一个标签,是一个可重复使用的量;而不同于方程中的变量,编程语言中的变量不仅仅是数值型,还可以是字符型、逻辑型等其他数据类型。
1.变量的性质
先定义后使用在python中引用变量需要先定义,否则会报错,但与其他编程语言如C语言不同,python定义变量不需要事先定义变量类型,变量类型随变量所赋值的类型决定可重复赋值及运算在python中变量可以重复赋值使用,变量间也可相互赋值,同时可以对变量进行运算操作#变量可重复赋值
i=2
i=3
#可对变量做运算
i+1
#查看变量的数据类型
type(a)
2.变量的命名规则
只能包含:数字、字母、下划线不能以数字开头,不能包含python保留字、关键字、函数名慎用小写字母l和大写字母O,避免与数字1和0混淆建议用驼峰命名法,即以单词加“命名,如:studentname#查看python有哪些保留字
importkeyword
print(keyword.kwlist)
3.变量的赋值
基本赋值在python中,我们使用“=”对变量进行赋值,如“x=3。这里要注意,数据和变量是分开存储的,即在内存中先建立数据“3”,然后建立一个标记“x”,再将x指向内存中的值。若重新对变量x赋值为“2”,实质上是修改了数据的引用,变量x重新指向内存中的数据“2”。
多重赋值对同一对象可以引用多个变量,例如一个人可以有多重身份,MrLi是一位父亲,同时也是一位教师,不同的变量,实质指向的对象是同一事物。father=teacher=MrLi
多元赋值对多个变量同时赋值,等号两边可加括号可不加a,b,c=1,2,3
(a,b,c)=(1,2,3)
语句
了解完算法中的“原料”,我们再来看看算法中的“操作说明”是什么呢?算法中的“操作说明”可以说是算法的“灵魂”,就好像一道菜完成的作品如何,很大程度取决于厨师的厨艺(即做菜秘籍)。构成算法“操作步骤”的是语句,其中包含python的基本语句和控制流程语句。控制流程语句的语法相对较复杂,在后面的文章再继续介绍,我们先认识一下python的基本语句:
其实前面我们已经接触过python的基础语句:赋值语句,赋值语句较简单不展开介绍,下面主要介绍python另一个使用特别广泛的基础语句:输出与输入语句。
1.输出语句
python中输出值的方式主要有两种:表达式和print()函数,两者的区别在于,表达式输出的结果为一个python对象,而在实际运用中,为方便阅读,通常需要按照一定格式输出结果,print()函数就很好地解决此问题。
print()语法:
print(*objects,sep=,end=\n,file=sys.stdout,flush=False)
print()参数:
objects--复数,表示可以一次输出多个对象。输出多个对象时,需要用,分隔。sep--用来间隔多个对象,默认值是一个空格。end--用来设定以什么结尾。默认值是换行符“\n”,可换成其他字符串。file--要写入的文件对象。flush--输出是否被缓存通常决定于file,但如果flush关键字参数为True,流会被强制刷新。#打印多个值,设置中间分隔符为“-”
print(广州,上海,深圳,sep=-)
#先以默认结尾符\n输出,再以结尾符设置为“-”,注意区别二者区别
print(广州)
print(上海)
print(深圳)
print(广州,end=-)
print(上海,end=-)
print(深圳,end=-)
以上代码实行结果为:
2.输入语句
在python中获取键盘输入数据的函数是input()函数,input函数会自动将输入的数据转为字符串类型,并自动忽略换行符,同时可给出提示字符串。如果需要得到其他类型的数据,可对其进行强制性类型转换。
input()语法:
input([prompt])
input()参数:
prompt:给输入者的提示信息,可选参数age=input(请输入您的年龄:)
如果您是以下几种情况之一:
想了解更多有关大数据分析、数据挖掘、机器学习、人工智能领域内容的好学者;职业遭遇瓶颈,想提升自己在数据分析或人工智能领域的硬件技能的在职人士;寻求新出路、新突破,有意向转行到数据分析行业或人工智能领域的求职人士;对未来摇摆不定,有兴趣想Python、数据分析、人工智能方向发展的在校大学生。可给我们私信,简要说明一下您的个人计划或学习需求,我会第一时间让专业的咨询顾问为您答疑解惑。