问题:大量数据中有些数据是文本格式,导致数据汇总不准确。分析:在工作中进行数据统计分析时会出现这种情况。工作中经常用Excel对数据进行统计分析,会汇总出一列数据,但总是出
问题:大量数据中有些数据是文本格式,导致数据汇总不准确。
分析:
在工作中进行数据统计分析时会出现这种情况。工作中经常用Excel对数据进行统计分析,会汇总出一列数据,但总是出现。总和与手动计算的数据不同。原因是什么?
结论:是由于制表、写表过程中数据不纯造成的,数据求和只针对“数”的格式(可加减的数据,如套路)。当数据显示为文本时,它不是以“数字”的形式,而是以文本的形式,因此不能进行求和计算。
例如:如下图所示,Excel中计算的总和是8800,但实际应该是11000。产生偏差的原因是付款金额中四个人的付款金额为文本格式,无法加减。
图1
下面是解决的方法:
首先选择这一列数据,选择“数据”–"分开",会弹出如下文本框,
图二
弹出文本框后,根据自己的需求进行选择。如果不需要划分数据,只需点击下一步,直到结束。操作完成后,都是常规格式,这是默认格式,会变成数据格式。如下图:
图3
这样,再次汇总付款金额栏,将是正确的数据。每次操作这么大的数据量,都会被正确的统计分析。
你以为超级简单?
分类还能实现哪些常用功能?
跟大家分享一个你在边肖工作中经常遇到的情况!
用法1:可以快速截取数据中的某一段,或者把一段超长的文字改成几个短的段落。
在工作中,我们会遇到需要提取一列中前几位数据的情况。比如下面的省份一栏(图4),我们想在没有其他市、区等信息的情况下,单独提取省份,可以通过公式实现,但是怎么才能更简单呢?
图4
这是通过以下排序功能实现的:
图5
选择要排序的单词,然后单击下一步。
图6
选择您需要的文本格式,
图7
然后选择剩余的文本并编辑它。
图8
你可以通过把数据分成几段来依次操作。如果不需要,可以选择不导入该列,如图8所示。转到此处完成操作。
用法2,操作ID号,挑出日期进行其他操作。
图9
身份证第7位依次代表年、月、日,倒数第二位代表性别。有时需要通过身份证信息提取信息,以增加数据的准确性和纯度。也可以通过排序快速实现。
图10
选择日期格式的日期列,然后单击完成。如果你想用日期格式显示它,只需编辑它的数字格式。
图11
图12
用同样的方法,可以筛选出有代表性的性别数据。
注:
(1)在排序操作过程中,要保留原数据列,排序后的数据要占据当前列。
(2)如果要把一个字符串分成多个字符串,那么要把要分成几列的空的白列做相应的插入,保证后面的数据不会被占用,原始数据不会丢失。
(3)只需要选择要处理的数据,不需要选择表头等其他信息。第一,排序不支持合并单元格的操作;第二,如果选择了表头,就会进行操作,增加了时间成本。