python导出chrome书签到markdown文件的实例代码

yizhihongxing

下面详细讲解如何使用 Python 导出 Chrome 书签到 Markdown 文件的实例代码。

准备工作

在开始之前,我们需要安装两个 Python 库:pandaspywin32。使用以下命令可安装:

pip install pandas
pip install pywin32

此外,我们还需要从 Chrome 中导出书签文件 bookmarks_YYYY_MM_DD.html,其中 YYYY_MM_DD 是文件生成日期。我们可以通过 Chrome 浏览器中的 书签管理器 -> 导出书签 来生成该文件。

注意:在进行文件导出时,需要勾选 包括网站描述和网址 选项,方便后面的处理。

实现过程

接下来就是实现过程了。将以下代码复制到 .py 文件中:

import pandas as pd
import win32com.client as win32

def chrome_bookmark_to_markdown(file_name):
    """
    将 Chrome 书签导出为 Markdown 格式
    :param file_name: Chrome 导出的书签文件路径
    """
    # 读取 HTML 文件
    bookmarks_list = pd.read_html(file_name, header=0)[0]

    # 创建 markdown 文件
    markdown_file_name = f'{file_name[:-5]}.md'
    markdown_file = open(markdown_file_name, mode='w', encoding='utf-8')

    # 将书签名称和 URL 写入 markdown 文件
    for index, row in bookmarks_list.iterrows():
        if '网址' in row[0]:
            markdown_file.write(f'- [{row[1]}]({row[2]})\n')
        else:
            markdown_file.write(f'\n## {row[0]}\n\n')

    markdown_file.close()

    # 将 markdown 文件转换为 PDF 文件
    word = win32.DispatchEx('Word.Application')
    docx_file_name = f'{file_name[:-5]}.docx'
    docx_file = f'{file_name[:-5]}.docx'
    word_doc = word.Documents.Open(markdown_file_name)
    word_doc.SaveAs(docx_file, FileFormat=16)  # FileFormat=16表示保存为PDF文件
    word_doc.Close()
    word.Quit()

代码中的 chrome_bookmark_to_markdown() 函数接受一个参数 file_name,为 Chrome 导出的书签文件路径,函数中包含两个主要步骤:

  1. 读取 Chrome 书签 HTML 文件,并将书签名称和 URL 写入 Markdown 文件。
  2. 将 Markdown 文件转为 PDF 文件。

函数中使用了 Python 标准库 pandas 来读取 Chrome 书签 HTML 文件,并转换为 DataFrame 对象。之后,将书签名称和 URL 写入 Markdown 文件,这里使用了 Pandas 的 iterrows() 函数,对 DataFrame 的每一行进行迭代。最后,使用 pywin32 库将 Markdown 文件转换为 PDF 文件。

示例说明

我们来看两个示例说明。

示例一

假设我们从 Chrome 中导出的文件名为 bookmarks_2022_01_01.html,我们可以将该文件名作为 chrome_bookmark_to_markdown() 函数中的参数传递,以将其转换为 Markdown 文件和 PDF 文件。

chrome_bookmark_to_markdown('bookmarks_2022_01_01.html')

这段代码会将 Chrome 导出的书签文件 bookmarks_2022_01_01.html 转换为 Markdown 文件和 PDF 文件,并命名为 bookmarks_2022_01_01.mdbookmarks_2022_01_01.pdf

示例二

假设我们想要将导出的书签文件 E:/chrome_bookmarks/bookmarks_2022_01_01.html 转换为 Markdown 文件和 PDF 文件,并保存到 E:/markdown_files 文件夹下。

import os

bookmarks_file = 'E:/chrome_bookmarks/bookmarks_2022_01_01.html'
markdown_folder = 'E:/markdown_files'

# 确保 markdown 文件夹存在
if not os.path.exists(markdown_folder):
    os.makedirs(markdown_folder)

# 调用 chrome_bookmark_to_markdown() 函数并指定 markdown 文件夹
os.chdir(markdown_folder)
chrome_bookmark_to_markdown(bookmarks_file)

这段代码会将 Chrome 导出的书签文件 bookmarks_2022_01_01.html 转换为 Markdown 文件和 PDF 文件,并保存到 E:/markdown_files/bookmarks_2022_01_01.mdE:/markdown_files/bookmarks_2022_01_01.pdf

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python导出chrome书签到markdown文件的实例代码 - Python技术站

(0)
上一篇 2023年5月31日
下一篇 2023年5月31日

相关文章

  • Python xpath,JsonPath,bs4的基本使用

    Python xpath, JsonPath, bs4的基本使用 在本教程中,我们将介绍Python中xpath、JsonPath和bs4的基本使用方法。这些工具可以帮助我们在爬虫过程中解析HTML、XML和JSON数据。我们将提供两个示例,演示如何使用这些工具。 XPath XPath是一种用于在XML文档中定位元素的语言。在Python中,我们可以使用l…

    python 2023年5月15日
    00
  • 基于Python制作天眼查小程序的示例代码

    下面是“基于Python制作天眼查小程序的示例代码”的完整攻略。 1. 需求分析 在开始编写代码之前,需要对需求进行分析。我们要制作一个“天眼查小程序”,用户可以通过输入公司名称,然后程序会返回相应的公司信息。这个小程序需要满足以下要求: 用户可以通过命令行输入公司名称; 程序会请求天眼查的API,并返回公司信息。 2. 进行API请求 我们首先需要进行AP…

    python 2023年5月23日
    00
  • Python中%r和%s的详解及区别

    Python中 %r 和 %s 的详解及区别 在 Python 中,可以使用 % 操作符来格式化字符串。其中 %s 和 %r 打印出来的字符串基本相同,但有时候它们输出的内容可能会有不同。本文将详细讲解 %s 和 %r 在 Python 中的使用。 什么是字符串格式化? 字符串格式化是指将一个字符串模板中的占位符替换为真正的数据。在 Python 中,以下方…

    python 2023年6月3日
    00
  • python实现猜单词游戏

    下面来详细讲解一下“python实现猜单词游戏”的完整攻略。该游戏的目的是让用户猜出随机生成的一个单词。 步骤1:导入random模块 在开始编写代码前,需要导入random模块,以便生成随机单词。 import random 步骤2:准备单词列表 接下来,需要准备一个单词列表,用于随机选择一个单词。 words_list = [‘apple’, ‘bana…

    python 2023年6月3日
    00
  • 详解用Python练习画个美队盾牌

    下面是“详解用Python练习画个美队盾牌”的完整攻略。 标题 首先,我们需要确定一下文章的标题,可以考虑以下几个标题: 用Python练习画个美队盾牌,过程详解 Python练习项目:画一个漂亮的美队盾牌 通过画美队盾牌的Python练习,提升你的绘画技能 步骤 接下来,我们进入正题——详解用Python练习画个美队盾牌的完整攻略。 第一步:准备工作在开始…

    python 2023年5月19日
    00
  • Windows下的Python 3.6.1的下载与安装图文详解(适合32位和64位)

    Windows下的Python3.6.1的下载与安装图文详解(适合32位和64位) 下载Python3.6.1安装包 首先,从Python官网下载Windows安装包。在页面http://www.python.org/downloads/windows/可以找到可供下载的Python版本。在该页面,可以看到所有的Python版本以及相应的安装包。 选择需要的…

    python 2023年5月13日
    00
  • Python配置mysql的教程(推荐)

    下面我将为你详细讲解“Python配置MySQL的教程(推荐)”的完整攻略。具体过程如下: 第一步:安装MySQL及其驱动 在Python中连接MySQL需要使用Python的MySQL驱动程序,官方推荐的驱动程序为mysql-connector-python。因此在配置MySQL之前,需要执行以下命令进行安装: pip install mysql-conn…

    python 2023年5月13日
    00
  • pip报错“OSError: [Errno 13] Permission denied: ‘/usr/local/lib/python3.6/dist-packages/pip/_internal/utils/entrypoints.pyi’”怎么处理?

    当使用pip安装Python包时,可能会遇到“ModuleNotFoundError: No module named ‘pip._vendor.requests.cookies’”错误。这个错误通常是由以下原因之一引起的: pip版本过低:如果pip版本过低,则可能会出现此错误。在这种情况下,需要升级pip版本。 pip安装文件损坏:如果pip安装文件损坏…

    python 2023年5月4日
    00
合作推广
合作推广
分享本页
返回顶部