全球即时:数据分析启蒙

2023-03-26 16:03:15来源:哔哩哔哩

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。


(相关资料图)

今天up决定实践一次,对2022年高考录取情况分析。

我们先在文件夹里建立input.txt和output.txt进行输入输出。其中output.txt是空的,而input.txt内容如下。

5.4 30.5 14 4.3

5.8 24.1 12.7 5.8

5.2 21.8 13.6 5.3

34.2 14.0 4.4 1.9

4.0 11.2 12.77 1.73

46.5 14.5 5.2 1.2

38.8 10.9 4.5 1.4

77 10.6 4.4 1.5

56 8.4 4.6 1.3

8.0 19.0 8.6 2.3

4.7 22.64 11.66 3.02

22.8 15.2 3.5 1.5

30.2 14.6 5.7 1.9

54.5 14.2 4.1 1.1

18.2 14.0 6.0 1.5

19.0 13.5 6.7 2.0

22.3 12.9 7.8 1.7

15.2 12.4 9.0 3.6

51.0 10.4 6.5 1.6

33.7 9.8 4.7 1.3

128.0 7.8 4.1 1.1

21.8 18.7 5.4 2.0

46 15.8 5.2 2.1

75 14.6 4.4 1.5

36.1 12.1 5.2 2.1

65.5 11.2 4.5 1.7

70.2 11.2 2.7 1.3

79.5 10.6 4.4 1.5

5.8 25.2 5.66 1.76

15.5 16.1 5.9 2.3

29.0 11.5 5.4 2.1

这是中国除了香港特别行政区,澳门特别行政区,和台湾省以外的31省市高考数据。

接着放入代码:

import sys#调出系统sys.stdin=open('input.txt','r')#r代表读取数据,打开input.txt读取数据。sys.stdout=open('output.txt','w')#w代表输出数据,打开output.txt输出数据。input=sys.stdin.readline#输入数据一行一行的读取n=31m=[]c=0b=0a=0total=0rate3=0rate2=0rate1=0for i in range(n):    m.append(list(map(float,input().split(" "))))#建立二维数组储存数据for i in range(0,31):    total=total+m[i][0]for i in range(0,31):    c=c+m[i][1]*0.01*m[i][0]for i in range(0,31):    b=b+m[i][2]*0.01*m[i][0]for i in range(0,31):    a=a+m[i][3]*0.01*m[i][0]rate3=round(c/total,3)*100rate2=round(b/total,3)*100rate1=round(a/total,3)*100print(f"全国本一率为{rate3}%,全国211率为{rate2}%,全国985率为{rate1}%。")

对于全国985,211,本一录取率,可以先计算每个省市985,211,本一的录取人数相加再除以总的考生人数,算出录取率。

特别注意,数据分析的程序只能在pycharm的界面上运行成功,idle无法得到结果。

关键词:

上一篇:
下一篇: