54_Pandas将DataFrame、Series转换为字典 (to_dict)
admin
2024-02-11 10:08:42
0

54_Pandas将DataFrame、Series转换为字典 (to_dict)

pandas.DataFrame、pandas.Series可以使用to_dict()方法转换为字典(dict类型对象)。

对于pandas.DataFrame,参数orient可以用来指定pandas.DataFrame的行标签索引、列标签列和值如何分配给字典的键和值。

在 pandas.Series 的情况下,它被转换为以标签作为键的字典。

此处解释以下内容。

  • pandas.DataFrame to_dict() 方法
    • 指定字典的格式:Argument orient
    • 转换为 dict 以外的类型:Argument into
  • 从 pandas.DataFrame 的任意两列生成字典
  • pandas.Series to_dict 方法 转换为 dict
    • 转换为 dict 以外的类型:Argument into

创建以下 pandas.DataFrame 作为示例。

import pandas as pd
import pprint
from collections import OrderedDictdf = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'x', '啊']},index=['row1', 'row2', 'row3'])print(df)
#       col1 col2
# row1     1    a
# row2     2    x
# row3     3    啊

它导入 pprint 以使输出更易于查看,并导入 OrderedDict 以通过参数解释类型规范。

pandas.DataFrame to_dict() 方法

当从 pandas.DataFrame 调用 to_dict() 方法时,默认情况下它将转换为字典(dict 类型对象),如下所示。

d = df.to_dict()pprint.pprint(d)
# {'col1': {'row1': 1, 'row2': 2, 'row3': 3},
#  'col2': {'row1': 'a', 'row2': 'x', 'row3': '啊'}}print(type(d))
# 

指定字典的格式:Argument orient

通过参数orient,可以指定pandas.DataFrame行标签(行名)索引、列标签(列名)列、值值如何分配给字典键和值的格式。

dict

如果 orient=‘dict’,key 是列标签,value 是行标签和值的字典。如果省略了 orient 参数(默认),则为这种格式。

{column -> {index -> value}}

d_dict = df.to_dict(orient='dict')pprint.pprint(d_dict)
# {'col1': {'row1': 1, 'row2': 2, 'row3': 3},
#  'col2': {'row1': 'a', 'row2': 'x', 'row3': '啊'}}print(d_dict['col1'])
# {'row1': 1, 'row2': 2, 'row3': 3}print(type(d_dict['col1']))
# 

list

如果 orient=‘list’,key 是列标签,value 是值列表。行名信息丢失。

{column -> [values]}

d_list = df.to_dict(orient='list')pprint.pprint(d_list)
# {'col1': [1, 2, 3], 'col2': ['a', 'x', '啊']}print(d_list['col1'])
# [1, 2, 3]print(type(d_list['col1']))
# 

series

如果 orient=‘series’,键是列标签,值是 pandas.Series,带有行标签和值。

{column -> Series(values)}

d_series = df.to_dict(orient='series')pprint.pprint(d_series)
# {'col1': row1    1
# row2    2
# row3    3
# Name: col1, dtype: int64,
#  'col2': row1    a
# row2    x
# row3    啊
# Name: col2, dtype: object}print(d_series['col1'])
# row1    1
# row2    2
# row3    3
# Name: col1, dtype: int64print(type(d_series['col1']))
# 

split

如果orient=‘split’,键为’index’、‘columns’、‘data’,values为行标签、列标签和值列表。

{index -> [index], columns -> [columns], data -> [values]}

d_split = df.to_dict(orient='split')pprint.pprint(d_split)
# {'columns': ['col1', 'col2'],
#  'data': [[1, 'a'], [2, 'x'], [3, '啊']],
#  'index': ['row1', 'row2', 'row3']}print(d_split['columns'])
# ['col1', 'col2']print(type(d_split['columns']))
# 

records

如果 orient=‘records’,它将是一个列表,其元素是字典,其中 key 是列标签,value 是值。行名信息丢失。

[{column -> value}, ... , {column -> value}]

l_records = df.to_dict(orient='records')pprint.pprint(l_records)
# [{'col1': 1, 'col2': 'a'}, {'col1': 2, 'col2': 'x'}, {'col1': 3, 'col2': '啊'}]print(type(l_records))
# print(l_records[0])
# {'col1': 1, 'col2': 'a'}print(type(l_records[0]))
# 

index

如果 orient=‘index’,则 key 是行标签,value 是列标签和值的字典。

{index -> {column -> value}}

d_index = df.to_dict(orient='index')pprint.pprint(d_index)
# {'row1': {'col1': 1, 'col2': 'a'},
#  'row2': {'col1': 2, 'col2': 'x'},
#  'row3': {'col1': 3, 'col2': '啊'}}print(d_index['row1'])
# {'col1': 1, 'col2': 'a'}print(type(d_index['row1']))
# 

转换为 dict 以外的类型:Argument into

通过为参数指定类型,它可以转换为子类,例如 OrderedDict,而不是字典(dict 类型)。

字典值value中存储的字典类型也将是指定的类型。

od = df.to_dict(into=OrderedDict)pprint.pprint(od)
# OrderedDict([('col1', OrderedDict([('row1', 1), ('row2', 2), ('row3', 3)])),
#              ('col2',
#               OrderedDict([('row1', 'a'), ('row2', 'x'), ('row3', '啊')]))])print(type(od))
# print(od['col1'])
# OrderedDict([('row1', 1), ('row2', 2), ('row3', 3)])print(type(od['col1']))
# 

从 pandas.DataFrame 的任意两列生成字典

还可以通过从索引和数据列中选择任意两列来创建字典。使用 dict() 和 zip()。

print(df.index)
# Index(['row1', 'row2', 'row3'], dtype='object')print(df['col1'])
# row1    1
# row2    2
# row3    3
# Name: col1, dtype: int64d_col = dict(zip(df.index, df['col1']))print(d_col)
# {'row1': 1, 'row2': 2, 'row3': 3}

pandas.Series to_dict 方法 转换为 dict

以下面的 pandas.Series 为例。

print(df)
#       col1 col2
# row1     1    a
# row2     2    x
# row3     3    啊s = df['col1']
print(s)
# row1    1
# row2    2
# row3    3
# Name: col1, dtype: int64print(type(s))
# 

当你在 pandas.Series 中调用 to_dict() 方法时,会创建一个字典,其中标签是键,值是值。

d = s.to_dict()
print(d)
# {'row1': 1, 'row2': 2, 'row3': 3}print(type(d))
# 

转换为 dict 以外的类型:Argument into

即使使用 pandas.Series 的 to_dict() 方法,通过在参数中指定类型 into,您也可以将其转换为子类,例如 OrderedDict,而不是字典(dict 类型)。

od = df['col1'].to_dict(OrderedDict)
print(od)
# OrderedDict([('row1', 1), ('row2', 2), ('row3', 3)])print(type(od))
# 

相关内容

热门资讯

荠菜是营养丰富的野菜 荠菜,又叫地地菜、芨菜、香善菜等。它含有丰富的营养。据化学分析:每公斤荠菜中约含蛋白质42.4克,糖...
原创 章... 2026年年初,互联网行业发生了两件很有意思的事。 一件是章泽天做了档播客,取名“小天章”。第一期视...
餐谋长 | 一个饮食习惯悄悄增... “全家围坐共餐”是多数家庭的生活常态,不少人将其视为团圆的象征,却忽视了不分餐、共用餐具带来的健康隐...
原创 朋... 在晨曦初破的宁静中,我们迎来了新的一天。如同诗人般,我愿以文字为笔,绘出一幅幅清晨正能量的经典画面。...
爱芯元智通过港交所聆讯 有望成... 本报讯 (记者梁傲男)1月25日,中国边缘AI芯片领军企业爱芯元智半导体股份有限公司(以下简称“爱芯...
002155,披露重大资产重组... 湖南黄金拟收购黄金天岳100%股权及中南冶炼100%股权,进一步完善产业布局。 同时,公司拟向不超过...
德力佳拟50亿元投建10兆瓦以... 【大河财立方消息】1月25日,德力佳传动科技(江苏)股份有限公司(简称德力佳)公告称,公司与无锡宛山...
特朗普的“中选经济强心针”:超... 美国消费者即将迎来一场规模空前的“现金雨”。 据追风交易台,根据摩根士丹利1月23日发布的最新研报,...
2025年IPO数据报告-投中... 2025 年中国企业 IPO 市场呈现止跌回升态势,全球范围内 294 家中国企业成功上市,IPO ...
山西银行锚定未来战略定位和经营... 文 | 中国金融网(CFN) 黄瑾 2026年1月下旬,山西银行密集召开2026年度工作会议、202...
思林杰并购告吹背后:对价砍了又... 深圳商报·读创客户端记者 梁佳彤 1月25日,思林杰(688115)发布公告称,公司分别召开第二届...
原创 昨... 特朗普批评加拿大被中国“吞食”,称关税将征收100%并嘲讽其“州长”,暴露霸权主义虚伪。 昨晚,特...
威尔鑫点金·׀ 美元因烽火戏诸... 美元因烽火戏诸侯遭遇重锤 金银再续强势逼空 2026年01月25日 威尔鑫投资咨询研究中心 (文...
钻石的眼泪,白银的沉默:当克拉... 钻戒的浪漫,是一场昂贵的误会? 那颗闪闪发光的石头,承载了多少海誓山盟。你以为买下的是一份永恒,一份...
贾国龙最新发声!“将回归一线,... 据媒体报道,西贝餐饮集团创始人贾国龙近日接受专访时表示,将回归一线、聚焦主业,不再打造个人IP。 贾...
阿里“平头哥”上市猜想引关注背... 上海浦东新区张江人工智能产业园内,一座灰橙交融的建筑静静矗立,平头哥半导体有限公司(以下简称平头哥)...
利好!千亿龙头完成金矿收购! 本报记者 肖艳青 1月25日晚间,洛阳栾川钼业集团股份有限公司(以下简称“洛阳钼业”)公告称,公司于...
原创 短... 刘阿姨大约从一年前开始断断续续出现腹痛、便秘症状,开始她没有当回事,觉得是胃肠道功能不好导致的,饮食...
旷达科技集团股份有限公司 第七... 证券代码:002516 证券简称:旷达科技 公告编号:2026-009 旷达科技集团股份有限公司 第...
原创 申... 离婚十三年,申通快递实控人被前夫追索分割财产。 作者 | 于婞 编辑丨高岩 来源 | 野马财经 19...