博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
爬虫4
阅读量:5310 次
发布时间:2019-06-14

本文共 1171 字,大约阅读时间需要 3 分钟。

1.xml是什么?

和json处在同一个位置,后端给前端传输数据的时候使用的数据格式,目前以json使用居多

xml:可扩展标记语言 html:超文本标记语言

不同: (1)xml用来传输和存储数据,html用来显示数据

(2)xml标签可以自行定义,html不行

(3)xml是纯文本信息,html是超文本信息 xpath是什么?xpath是用来解析xml数据的

xpath和html有什么关系?

因为xml和html的结构一模一样,所以能不能使用xpath解析html数据呢?能,有一个第三方库实现了这个功能,lxml pip install lxml

2.xpath语法

常用的路径表达式

/ 从根节点开始查找

// 从任意位置开始查找
. 从当前节点开始查找
.. 从当前节点的父节点开始查找
@ 选取属性

xpath在代码中的应用

(1)可以解析本地文件 from lxml import etree tree = etree.parse(文件名) ret = tree.xpath('路径表达式') 返回的是一个列表

(2)可以解析网络文件 tree = etree.HTML(网络文件字符串内容)

json格式的语法: json比xml更小、更快、更易解析 (1)数据保存在键值对中 (2)键值对以逗号分隔 (3){} 保存对象 (4)[] 保存数组 键值对写法:键一般都是字符串,字符串要以双引号引起来 值可以是: 数字、浮点 字符串,必须在双引号中 布尔值 true false 数组 [] 对象 {}

3.python 如何解析json格式

(1)自带模块解析 import json json.dumps(): 将python字典、列表转化为json格式字符串 string = json.dumps(lt, ensure_ascii=False) json.loads(): 将json格式字符串转化为python字典、列表 obj = json.loads(string) json.dump(): 将python字典、列表转化为json格式字符串并且直接写入文件中 json.load(): 从文件中读取json格式的字符串转化为python字典、列表

(2)jsonpath(了解) jsonpath是什么?

就是用来解析json数据的 obj jsonpath和xpath对比 / $ 根元素 / . 层级分隔符 // .. 任意位置开始查找 索引,xpath从1开始,jsonpath从0开始 http://blog.csdn.net/luxideyao/article/details/77802389

 

转载于:https://www.cnblogs.com/helloqaz/p/9914568.html

你可能感兴趣的文章
鼠标悬停提示文本消息最简单的做法
查看>>
Java面向对象重要关键字
查看>>
课后作业-阅读任务-阅读提问-2
查看>>
面向对象设计中private,public,protected的访问控制原则及静态代码块的初始化顺序...
查看>>
fat32转ntfs ,Win7系统提示对于目标文件系统文件过大解决教程
查看>>
500 Lines or Less
查看>>
adb devices unauthorized的解决办法
查看>>
ubuntu qq
查看>>
串口调试工具
查看>>
Awesome Adb——一份超全超详细的 ADB 用法大全
查看>>
shell cat 合并文件,合并数据库sql文件
查看>>
通过adb命令查看SN、CID码等信息
查看>>
linux 常用shell命令之wc
查看>>
win 解除鼠标右键关联
查看>>
Android 将drawable下的图片转换成bitmap、Drawable
查看>>
介绍Win7 win8 上Java环境的配置
查看>>
Android源码编译9步---Nexus 设备出厂镜像
查看>>
fatal: early EOF fatal: index-pack failed & Git, fatal: The remote end hung up unexpectedly
查看>>
移动、联通和电信,哪家的宽带好,看完你就知道该怎么选了!
查看>>
Linux设置环境变量的方法
查看>>