54_Pandas将DataFrame、Series转换为字典 (to_dict)
admin
2024-02-11 10:08:42
0

54_Pandas将DataFrame、Series转换为字典 (to_dict)

pandas.DataFrame、pandas.Series可以使用to_dict()方法转换为字典(dict类型对象)。

对于pandas.DataFrame,参数orient可以用来指定pandas.DataFrame的行标签索引、列标签列和值如何分配给字典的键和值。

在 pandas.Series 的情况下,它被转换为以标签作为键的字典。

此处解释以下内容。

  • pandas.DataFrame to_dict() 方法
    • 指定字典的格式:Argument orient
    • 转换为 dict 以外的类型:Argument into
  • 从 pandas.DataFrame 的任意两列生成字典
  • pandas.Series to_dict 方法 转换为 dict
    • 转换为 dict 以外的类型:Argument into

创建以下 pandas.DataFrame 作为示例。

import pandas as pd
import pprint
from collections import OrderedDictdf = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'x', '啊']},index=['row1', 'row2', 'row3'])print(df)
#       col1 col2
# row1     1    a
# row2     2    x
# row3     3    啊

它导入 pprint 以使输出更易于查看,并导入 OrderedDict 以通过参数解释类型规范。

pandas.DataFrame to_dict() 方法

当从 pandas.DataFrame 调用 to_dict() 方法时,默认情况下它将转换为字典(dict 类型对象),如下所示。

d = df.to_dict()pprint.pprint(d)
# {'col1': {'row1': 1, 'row2': 2, 'row3': 3},
#  'col2': {'row1': 'a', 'row2': 'x', 'row3': '啊'}}print(type(d))
# 

指定字典的格式:Argument orient

通过参数orient,可以指定pandas.DataFrame行标签(行名)索引、列标签(列名)列、值值如何分配给字典键和值的格式。

dict

如果 orient=‘dict’,key 是列标签,value 是行标签和值的字典。如果省略了 orient 参数(默认),则为这种格式。

{column -> {index -> value}}

d_dict = df.to_dict(orient='dict')pprint.pprint(d_dict)
# {'col1': {'row1': 1, 'row2': 2, 'row3': 3},
#  'col2': {'row1': 'a', 'row2': 'x', 'row3': '啊'}}print(d_dict['col1'])
# {'row1': 1, 'row2': 2, 'row3': 3}print(type(d_dict['col1']))
# 

list

如果 orient=‘list’,key 是列标签,value 是值列表。行名信息丢失。

{column -> [values]}

d_list = df.to_dict(orient='list')pprint.pprint(d_list)
# {'col1': [1, 2, 3], 'col2': ['a', 'x', '啊']}print(d_list['col1'])
# [1, 2, 3]print(type(d_list['col1']))
# 

series

如果 orient=‘series’,键是列标签,值是 pandas.Series,带有行标签和值。

{column -> Series(values)}

d_series = df.to_dict(orient='series')pprint.pprint(d_series)
# {'col1': row1    1
# row2    2
# row3    3
# Name: col1, dtype: int64,
#  'col2': row1    a
# row2    x
# row3    啊
# Name: col2, dtype: object}print(d_series['col1'])
# row1    1
# row2    2
# row3    3
# Name: col1, dtype: int64print(type(d_series['col1']))
# 

split

如果orient=‘split’,键为’index’、‘columns’、‘data’,values为行标签、列标签和值列表。

{index -> [index], columns -> [columns], data -> [values]}

d_split = df.to_dict(orient='split')pprint.pprint(d_split)
# {'columns': ['col1', 'col2'],
#  'data': [[1, 'a'], [2, 'x'], [3, '啊']],
#  'index': ['row1', 'row2', 'row3']}print(d_split['columns'])
# ['col1', 'col2']print(type(d_split['columns']))
# 

records

如果 orient=‘records’,它将是一个列表,其元素是字典,其中 key 是列标签,value 是值。行名信息丢失。

[{column -> value}, ... , {column -> value}]

l_records = df.to_dict(orient='records')pprint.pprint(l_records)
# [{'col1': 1, 'col2': 'a'}, {'col1': 2, 'col2': 'x'}, {'col1': 3, 'col2': '啊'}]print(type(l_records))
# print(l_records[0])
# {'col1': 1, 'col2': 'a'}print(type(l_records[0]))
# 

index

如果 orient=‘index’,则 key 是行标签,value 是列标签和值的字典。

{index -> {column -> value}}

d_index = df.to_dict(orient='index')pprint.pprint(d_index)
# {'row1': {'col1': 1, 'col2': 'a'},
#  'row2': {'col1': 2, 'col2': 'x'},
#  'row3': {'col1': 3, 'col2': '啊'}}print(d_index['row1'])
# {'col1': 1, 'col2': 'a'}print(type(d_index['row1']))
# 

转换为 dict 以外的类型:Argument into

通过为参数指定类型,它可以转换为子类,例如 OrderedDict,而不是字典(dict 类型)。

字典值value中存储的字典类型也将是指定的类型。

od = df.to_dict(into=OrderedDict)pprint.pprint(od)
# OrderedDict([('col1', OrderedDict([('row1', 1), ('row2', 2), ('row3', 3)])),
#              ('col2',
#               OrderedDict([('row1', 'a'), ('row2', 'x'), ('row3', '啊')]))])print(type(od))
# print(od['col1'])
# OrderedDict([('row1', 1), ('row2', 2), ('row3', 3)])print(type(od['col1']))
# 

从 pandas.DataFrame 的任意两列生成字典

还可以通过从索引和数据列中选择任意两列来创建字典。使用 dict() 和 zip()。

print(df.index)
# Index(['row1', 'row2', 'row3'], dtype='object')print(df['col1'])
# row1    1
# row2    2
# row3    3
# Name: col1, dtype: int64d_col = dict(zip(df.index, df['col1']))print(d_col)
# {'row1': 1, 'row2': 2, 'row3': 3}

pandas.Series to_dict 方法 转换为 dict

以下面的 pandas.Series 为例。

print(df)
#       col1 col2
# row1     1    a
# row2     2    x
# row3     3    啊s = df['col1']
print(s)
# row1    1
# row2    2
# row3    3
# Name: col1, dtype: int64print(type(s))
# 

当你在 pandas.Series 中调用 to_dict() 方法时,会创建一个字典,其中标签是键,值是值。

d = s.to_dict()
print(d)
# {'row1': 1, 'row2': 2, 'row3': 3}print(type(d))
# 

转换为 dict 以外的类型:Argument into

即使使用 pandas.Series 的 to_dict() 方法,通过在参数中指定类型 into,您也可以将其转换为子类,例如 OrderedDict,而不是字典(dict 类型)。

od = df['col1'].to_dict(OrderedDict)
print(od)
# OrderedDict([('row1', 1), ('row2', 2), ('row3', 3)])print(type(od))
# 

相关内容

热门资讯

陕西农信陈仓联社:深耕本土惠民... 为持续优化辖区支付服务生态,完善本地便民消费场景,切实解决商户经营收款痛点、提升群众消费支付体验,陈...
又一家公司AI优先,裁员20%... 多知5月9日消息,美国科技企业 Cloudflare 周四在2026年Q1分析师电话会议上宣布裁员 ...
钟可祥任厦门钨业董事长 天眼查App显示,近日,厦门钨业(600549)发生工商变更,黄长庚卸任法定代表人、董事长,由钟可祥...
南昌第五医院甲状腺科江辉:甲状... 请教一下,我已在一侧甲状腺切除手术后过去了半个月,如今是否可以适量食用海参、鱼、虾、蟹? 答:鉴于甲...
原创 今... 5月9日这波金价,得跟大伙唠唠,放在近15年行情里算少见,以前2011年欧债危机、2020年全球避险...
华芢生物港股上市后首份年报:暂... 3月30日,华芢生物科技(青岛)股份有限公司发布了自2025年12月登陆港交所以来的第一份年度业绩报...
侃财邦|“双豆CP”,老少皆宜... 提到手作消费,你想到的还是商场里供儿童娱乐的石膏娃娃、沙画?如今,拼豆、豆荚娃娃这对“双豆CP”,已...
中外专家热议将海南自贸港打造成... 2026年5月8日下午,由中国日报社、中国(海南)改革发展研究院联合主办的2026 RCEP区域发展...
原创 割... 现在的消费市场,总有层出不穷的新噱头,专门瞄准年轻人的钱包。你有没有发现,最近不管是写字楼的茶水间,...
阿里 京东 字节三大互联网巨头... 在数字经济深度渗透的当下,互联网企业与物流供应链的融合已成为驱动行业高质量发展的核心引擎,二者的协同...
2026年5月更新:上海高价红... 在高端消费与资产配置领域,红酒,尤其是名庄酒,早已超越了单纯的饮品范畴,成为一种具有收藏价值与**属...
2000-2023年上市公司融... 上市公司融资结构是指企业在筹集资金时,不同融资方式的构成及其比例关系。这通常涵盖内源融资与外源融资两...
苏州银行:不断调优信贷结构 争... 来源:上海证券报·中国证券网 上证报中国证券网讯 苏州银行5月8日晚间发布最新的机构调研纪要。该行今...
黄红日就任民生银行首席合规官 上证报中国证券网讯(记者 张琼斯)民生银行5月8日发布的关于首席合规官任职资格获国家金融监督管理总局...
文化和旅游部公布2026年第二...   原标题:旅游市场强制消费问题典型案例(2026年第二批)   “纠治旅游行业导游乱象、强制消费等...
7室5厅6卫,恒大原总裁豪宅被... 近日,广州市天河区清风南街11号的一套428平方米复式楼,被广州天河区人民法院在阿里法拍网挂拍,起拍...
原创 6... 俄罗斯于5月9日在莫斯科红场举行的反法西斯战争胜利81周年阅兵仪式吸引了全球的目光。这不仅仅是一场军...
庆祝5·12国际护士节系列活动... 新闻 为庆祝5·12国际护士节,我院护理部组织各专业护理骨干开展系列护理健康科普义诊活动。 庆祝护士...
合肥贵金属回收商家深度测评:资... 一、行业背景与测评方法论 据《2025年中国二手奢侈品及贵金属回收市场白皮书》数据显示,2025年全...
2026国内正规现货黄金交易平... 步入2026年第二季度,全球货币政策的转向与地缘经济的重构,使得现货黄金的避险属性再度成为财富管理的...