关于pandas处理数据,怎么提取某一列的部分数字

2024-05-06 00:52

1. 关于pandas处理数据,怎么提取某一列的部分数字

可以使用left字符截取函数来实现。

Excel版本参考:2010

假设数据在A列

具体步骤及演示:

1、B1输入公式:=LEFT(A1,LEN(A1)-5)

2、下拉公式,完成

公式简单解析:

1、left语法:left(单元格,字符个数),从左边截取

2、len语法:len(单元格),返回单元格中字符的长度!

关于pandas处理数据,怎么提取某一列的部分数字

2. python panda怎么提取列数据

创建数据

通过Python的zip构造出一元组组成的列表作为DataFrame的输入数据rec。

In [3]: import pandas as pd
In [4]: import random
In [5]: num = random.sample(xrange(10000, 1000000), 5)
In [6]: num
Out[6]: [244937, 132008, 278446, 613409, 799201]
In [8]: names = "hello the cruel world en".split()
In [9]: names
Out[9]: ['hello', 'the', 'cruel', 'world', 'en']
In [10]: rec = zip(names, num)
In [15]: data = pd.DataFrame(rec, columns = [u"姓名",u"业绩" ])
In [16]: data
Out[16]:
     姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201 

DataFrame方法函数的第一个参数是数据源,第二个参数columns是输出数据表的表头,或者说是表格的字段名。

导出数据csv

Windows平台上的编码问题,我们可以先做个简单处理,是ipython-notebook支持utf8.
import sys
reload(sys)
sys.setdefaultencoding("utf8")

接下来可以数据导出了。
In [31]: data
Out[31]:
     姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201 
#在ipython-note里后加问号可查帮助,q退出帮助
In [32]: data.to_csv?
In [33]: data.to_csv("c:\\out.csv", index = True, header = [u"雇员", u"销售业绩"])

将data导出到out.csv文件里,index参数是指是否有主索引,header如果不指定则是以data里columns为头,如果指定则是以后边列表里的字符串为表头,但要注意的是header后的字符串列表的个数要和data里的columns字段个数相同。

可到c盘用Notepad++打开out.csv看看。

简单的数据分析
In [43]: data
Out[43]:
     姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201
#排序并取前三名
In [46]: Sorted = data.sort([u"业绩"], ascending=False)
         Sorted.head(3)
Out[46]:
     姓名  业绩
4    en      799201
3    world   613409
2    cruel   278446

图形输出
In [71]: import matplotlib.pyplot as plt
         #使ipython-notebook支持matplotlib绘图
         %matplotlib inline
In [74]: df = data
         #绘图
         df[u"业绩"].plot()
         MaxValue = df[u"业绩"].max()
         MaxName = df[u"姓名"][df[u"业绩"] == df[u"业绩"].max()].values
         Text = str(MaxValue) + " - " + MaxName
         #给图添加文本标注
         plt.annotate(Text, xy=(1, MaxValue), xytext=(8, 0), xycoords=('axes fraction', 'data'), textcoords='offset points')

如果注释掉plt.annotate这行

3. python如何获取指定列表名和其中的值?

从整个数据库中获取列名(假设数据库包含超过100行,超过50列),基于pandas中特定列中包含的特定值.
在Bkmm3(来自印度的成员)的帮助下,我在数字术语上取得了成功但在字母术语上失败了.我试过的方式是这样的:
df = pd.DataFrame({'A':['APPLE','BALL','CAT'],
'B':['ACTION','BATMAN','CATCHUP'],
'C':['ADVERTISE','BEAST','CARTOON']})
response = input("input")
for i in df.columns: if(len(df.query(i + '==' + str(response))) > 0):
print(i)`
然后输出出现错误:
Traceback (most recent call last): NameError: name 'APPLE' is not defined
你们的任何帮助都会非常感谢,谢谢. . .
解决方法:
isin / eq适用于DataFrames,您可以100%向量化:
df.columns[df.isin(['APPLE']).any()] # df.isin([response])
要么,
df.columns[df.eq(response).any()]
索引([‘A’],dtype =’对象’)
这是使用DataFrame.eval和np.logical_or的迂回方式(你是在循环列上):
df.columns[
np.logical_or.reduce(
[df.eval(f"{repr(response)} in {i}") for i in df]
)]
Index(['A'], dtype='object')

python如何获取指定列表名和其中的值?

4. Python, pandas 取一列的前两位数字?

df.编号.astype(str).str.slice(0,2)
或
df.编号.astype(str).str[:2]

5. python,pandas怎么提取索引的值?

a = {'一': ["A", "B", "C"], '二': ["D", "E", "F"]}b = list(a.values())print(b[1]) # ['D', 'E', 'F']

python,pandas怎么提取索引的值?

6. Python用Pandas提取Excel指定的数据

看不出表A的第2条、第2条没法总结规律,只能按照第2、3、4行用Pandas静态转换为汇总表的行。

7. python怎么提取excel中某一行的数据?

# 使用下面的方法首先你需要 pandas 包:pip install pandasimport pandas as pdtable = pd.read_excel('D://table.xlsx')b = table['B']

python怎么提取excel中某一行的数据?

8. pandas两个有相同列的dataframe怎么提取数据

如果你要添加一千条记录,不要一条一条的concate。可以试着每一百条组成一个小的dataframe,分十次粘上去,会快一点
最新文章
热门文章
推荐阅读