如何用html写书

原理:利用xml.etree.ElementTree对html进行解析和写入

# encoding=utf-8
import xml.etree.ElementTree as ET # 解析html、xml

name = input('type in file name:')


def circle():
tree = ET.parse(f'{name}.html') # 解析文件
root = tree.getroot() # 获取根节点
link_div = root.find('div[@id="link"]') # 获取link区的div节点。注意find和findall只能查找直接子元素
body_div = root.find('div[@id="body"]') # 获取body区的div节点
h1List = link_div.findall('div')
for i in h1List: # 列出所有h1标题
print(i.find('h1').find('a').text)

def create_h1(): # 创造h1节点
tree = ET.parse(f'{name}.html') # 用于刷新节点
root = tree.getroot() # 获取根节点
link_div = root.find('div[@id="link"]')
body_div = root.find('div[@id="body"]')
h1List = link_div.findall('div')
print('输入again回到程序开始处,输入exit退出程序')
h1_text = input('输入章节名:')
if h1_text == 'again':
circle()
elif h1_text == 'exit':
print('program terminated!')
else:
page = input('页数:')
h1_link_div = ET.Element('div') # 创造节点
h1_link_h1 = ET.Element('h1')
h1_link_a = ET.Element('a')
h1_link_a.text = f'{len(h1List) + 1}、' + h1_text + '(p' + page + ')'
h1_link_a.set('href', f'#{len(h1List) + 1}') # 设置a节点的属性
h1_link_h1.append(h1_link_a) # 悬挂节点
h1_link_div.append(h1_link_h1)
link_div.append(h1_link_div) # 写入link区
h1_body_div = ET.Element('div') # 创造节点
h1_body_h1 = ET.Element('h1')
h1_body_h1_a = ET.Element('a')
h1_body_h1_a.text = '回到顶部' # 设置回到顶部的链接
h1_body_h1_a.set('href', '#link')
h1_body_h1.text = f'{len(h1List) + 1}、' + h1_text + '(p' + page + ')'
h1_body_div.set('id', f'{len(h1List) + 1}')
h1_body_div.append(h1_body_h1)
h1_body_div.append(h1_body_h1_a)
body_div.append(h1_body_div) # 写入body区
newTree = ET.ElementTree(root) # root为修改后的root
newTree.write(f'{name}.html', encoding='utf-8') # 重新写入xml,进行更新。需要声明编码,否则写入后会乱码
create_h1()

def create_h2(): # 创造h2节点
tree = ET.parse(f'{name}.html') # 用于刷新节点
root = tree.getroot() # 获取根节点
link_div = root.find('div[@id="link"]')
body_div = root.find('div[@id="body"]')
h1List = link_div.findall('div')
h2List = link_div.findall('div')[int(a) - 1].findall('div')
print('输入again回到程序开始处,输入exit退出程序')
h2_text = input('输入章节名:')
if h2_text == 'again':
circle()
elif h2_text == 'exit':
print('program terminated!')
else:
page = input('页数:')
h2_link_div = ET.Element('div')
h2_link_h2 = ET.Element('h2')
h2_link_a = ET.Element('a')
h2_link_a.text = a + f'.{len(h2List) + 1}、' + h2_text + '(p' + page + ')'
h2_link_a.set('href', '#' + a + f'_{len(h2List) + 1}')
h2_link_h2.append(h2_link_a)
h2_link_div.append(h2_link_h2)
h1List[int(a) - 1].append(h2_link_div)
h2_body_div = ET.Element('div')
h2_body_h2 = ET.Element('h2')
h2_body_h2_a = ET.Element('a')
h2_body_h2_a.text = '回到顶部'
h2_body_h2_a.set('href', '#link')
h2_body_h2.text = a + f'.{len(h2List) + 1}、' + h2_text + '(p' + page + ')'
h2_body_div.set('id', a + f'_{len(h2List) + 1}')
h2_body_div.append(h2_body_h2)
h2_body_div.append(h2_body_h2_a)
body_div.findall('div')[int(a) - 1].append(h2_body_div)
newTree = ET.ElementTree(root)
newTree.write(f'{name}.html', encoding='utf-8')
create_h2()

def create_statement(): # 创造h2下的内容
tree = ET.parse(f'{name}.html') # 用于刷新节点
root = tree.getroot() # 获取根节点
body_div = root.find('div[@id="body"]')
h2 = body_div.findall('div')[int(a) - 1].findall('div')[int(b) - 1]
print('输入again回到程序开始处,输入exit退出程序')
p_text = input('输入内容:')
if p_text == 'again':
circle()
elif p_text == 'exit':
print('program terminated!')
else:
page = input('页数:')
p = ET.Element('p')
p.text = p_text + '(p' + page + ')'
h2.append(p)
newTree = ET.ElementTree(root)
newTree.write(f'{name}.html', encoding='utf-8')
create_statement()

print('在此处创建输入0\n选择章节输入序号')
a = input('输入:') # 输入的为字符串而非数字
if a == '0':
create_h1()
else:
h2List = link_div.findall('div')[int(a) - 1].findall('div')
for i in h2List: # 列出所有h2标题
print(i.find('h2').find('a').text)
print('在此处创建输入0\n选择章节输入序号')
b = input('输入:')
if b == '0':
create_h2()
else:
h2 = body_div.findall('div')[int(a) - 1].findall('div')[int(b) - 1] # 选择的h2节点
pList = h2.findall('p') # 列出所有h2标题下的内容
for i in pList:
print(i.text)
create_statement()


circle() # 循环往复

注意千万要仔细检查,本人就是因为某个变量打错字了,没有发现,耽搁了很久……总之现在是顺利地解决了

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何用html写书 - Python技术站

(0)
上一篇 2023年4月2日
下一篇 2023年4月2日

相关文章

  • python输入和输出

    输出 1、表达式语句 2、print() 3、write() 美化输出格式 repr()产生一个解释器易读的表达形式: a = ‘the sea has bank\nmy love is boundless’ print(a) print(repr(a)) # 可以转义特殊字符 结果为: the sea has bank my love is boundle…

    Python开发 2023年4月2日
    00
  • python运算符

    算术运算符: + – * / % ** //   比较运算符: == != > < >= <=   赋值运算符: = += -= *= /= %= **= //= :=(海象运算符)   其中海象运算符用于在表达式内部为变量赋值: name = ‘大湘菜’ if n := len(name) < 4: print(‘a nice…

    Python开发 2023年4月2日
    00
  • python模块

    python模块是一个py文件,一个模块只会被导入一次   python在编译或安装的时候会确定搜索路径,使用import语句的时候,python解释器就从搜索路径(即一系列目录名)中查找模块 import sys print(sys.argv) # 命令行参数 print(sys.path) # 路径 结果为: [‘D:/Pycharm/pythonPro…

    Python开发 2023年4月2日
    00
  • python循环语句

    while循环 一般形式: while condition:   statement1 else:   statement2   a = 0 while a < 3: print(a) a = a + 1 else: print(a, ” 大于或等于3″) 结果为: 0 1 2 3 大于或等于3   无限循环: while True: # 或者一个永远…

    Python开发 2023年4月2日
    00
  • 如何使用appnium爬取视频数据

    要先安装Appium,并用它来查找对应元素的id、xpath等信息   from appium import webdriver from appium.webdriver.extensions.android.nativekey import AndroidKey from selenium.webdriver.common.by import By im…

    Python开发 2023年4月2日
    00
  • python爬虫

    Web请求过程 1、服务器渲染:在服务器那边直接把数据和html整合在一起,统一返回给浏览器 在页面源代码中能看到数据 2、客户端渲染:第一次请求只有一个html骨架,第二次请求拿到数据,进行数据展示(一般为XHR) 在页面源代码中看不到数据 <可用检查网页或者F12来查看>   HTTP协议 Hyper Text Transfer Protoc…

    Python开发 2023年4月2日
    00
  • python基本数据类型

    python的变量不需要声明,但在使用前必须要赋值   多个变量赋值: a = b = c = 1 x, y, z = 1, True, ‘大湘菜’   python有六个标准的数据类型: Number、String、Tuple、List、Set、Dictionary,其中前三者为不可变数据,后三者为可变数据   Number: a, b, c, d = 1…

    Python开发 2023年4月2日
    00
  • python面向对象

    传统的结构化设计方法的基本点是面向过程,系统被分解成若干个过程。而面向对象的方法是采用构造模型的观点,在系统的开发过程中,各个步骤的共同的目标是建造一个问题域的模型。在面向对象的设计中,初始元素是对象,然后将具有共同特征的对象归纳成类,组织类之间的等级关系,构造类库。在应用时,在类库中选择相应的类 面向对象编程的主要思想是把构成问题的各个事务分解成各个对象,…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部