Python 格式转换
在 Python 中,我们经常需要处理各种数据格式,我们需要将一种格式的数据转换为另一种格式,本文将介绍如何在 Python 中进行常见的数据格式转换。
1、文本文件与二进制文件
文本文件和二进制文件是两种常见的数据存储格式,文本文件以纯文本形式存储数据,而二进制文件则以字节流的形式存储数据,在 Python 中,我们可以使用内置的 open()
函数来读取和写入这两种格式的文件。
将一个文本文件转换为二进制文件:
with open("input.txt", "r") as f: content = f.read() with open("output.bin", "wb") as f: f.write(content.encode("utf-8"))
2、JSON 与 CSV
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,常用于 Web 应用程序中,CSV(Comma-Separated Values)是一种简单的表格数据格式,可以用逗号分隔的值表示数据,在 Python 中,我们可以使用内置的 json
模块和第三方库 csv
来处理这两种格式的数据。
将一个 JSON 文件转换为 CSV 文件:
import json import csv with open("input.json", "r") as f: data = json.load(f) with open("output.csv", "w", newline="") as f: writer = csv.writer(f) writer.writerow(data[0].keys()) for row in data: writer.writerow(row.values())
3、XML 与 HTML
XML(eXtensible Markup Language)是一种可扩展的标记语言,用于描述数据,HTML(HyperText Markup Language)是一种用于创建网页的标记语言,在 Python 中,我们可以使用第三方库 xml.etree.ElementTree
和 BeautifulSoup
来处理这两种格式的数据。
将一个 XML 文件转换为 HTML 文件:
from bs4 import BeautifulSoup import xml.etree.ElementTree as ET tree = ET.parse("input.xml") root = tree.getroot() html = BeautifulSoup("<html><body></body></html>", "html.parser") body = html.find("body") for child in root: p = html.new_tag("p") p.string = str(child.text) body.append(p) with open("output.html", "w") as f: f.write(str(html))
4、Excel 与 Pandas DataFrame
Excel 是一种常见的电子表格格式,通常用于数据分析和处理,Pandas 是一个强大的数据处理库,支持多种数据格式的读写,在 Python 中,我们可以使用第三方库 pandas
来处理这两种格式的数据。
将一个 Excel 文件转换为 Pandas DataFrame:
import pandas as pd df = pd.read_excel("input.xlsx") print(df)
Python 提供了丰富的内置功能和第三方库,使得我们在处理各种数据格式时更加方便,希望本文能帮助您更好地理解如何在 Python 中进行数据格式转换。
还没有评论,来说两句吧...