python解析Chrome浏览器历史浏览记录和收藏夹数据
⽬录
前⾔
(⼀)查询chrome数据缓存地址
(⼆)提取收藏夹数据
1.⽂件路径
2.解析代码
(三)查看浏览历史数据
1.⽂件路径
2.解析代码
(四)完整代码&测试代码
总结
前⾔
常使⽤chrome浏览器作为⾃⼰的默认浏览器,也喜欢使⽤浏览器来收藏⾃⼰的喜欢的有⽤的链接,⾃⼰也做了⼀个记录笔记
的⼩脚本,想扩展收录chrome浏览器收藏夹的内容,,下⾯,,使⽤python提取chrome浏览器的历史记录,以及收藏夹。
(⼀)查询chrome数据缓存地址
1.打开chrome浏览器,输⼊chrome://version,进⼊浏览器版本信息页⾯2.复制页⾯下图,划线地址
(⼆)提取收藏夹数据
1.⽂件路径
上⾯我的chrome浏览器的缓存路径是:
C:UrsAdministratorAppDataLocalGoogleChromeUrDataDefault
浏览器的收藏夹的数据,记录在Bookmarks⽂件⾥⾯
Bookmark⽂件的内容格式是json
2.解析代码
解析代码为
importos
importjson
#chromedatapath
path="C:/Urs/Administrator/AppData/Local/Google/Chrome/UrData/Default"
#chromebrowrbookmark
classBookMark:
def__init__(lf,chromePath=path):
#chromepath
Path=chromePath
#parbookmarks
withopen((path,'Bookmarks'),encoding='utf-8')asf:
bookmarks=(())
rks=bookmarks
#folders
s=_folders()
defget_folders(lf):
#folders
names=[
(i,rks['roots'][i]['name'])
rks['roots']
]
returnnames
defget_folder_data(lf,folder=0):
rks['roots'][s[folder][0]]['children']
deft_chrome_path(lf,chromePath):
Path=chromePath
defrefresh(lf):
'updatechromedatafromchromepath'
#parbookmarks
withopen((path,'Bookmarks'),encoding='utf-8')asf:
bookmarks=(())
rks=bookmarks
(三)查看浏览历史数据
1.⽂件路径
历史数据,存储在下⾯的History⽂件⾥⾯,内容格式是sqlite的数据库⽂件,可以直接使⽤sqlite3来解析,当然也可以使⽤DB
BrowrforSQLite来图形化界⾯显⽰Historysqlite数据⽂件。
2.解析代码
importos
importsqlite3
#chromedatapath
path="C:/Urs/Administrator/AppData/Local/Google/Chrome/UrData/Default"
#History
classHistory:
def__init__(lf,chromePath=path):
Path=chromePath
defconnect(lf):
=t((Path,"History"))
=()
defclo(lf):
()
defget_history(lf):
cursor=e("SELECTid,url,title,visit_countfromurls")
rows=[]
for_id,url,title,visit_countincursor:
row={}
row['id']=_id
row['url']=url
row['title']=title
row['visit_count']=visit_count
(row)
returnrows
(四)完整代码&测试代码
importos
importsqlite3
#chromedatapath
path="C:/Urs/Administrator/AppData/Local/Google/Chrome/UrData/Default"
#History
classHistory:
def__init__(lf,chromePath=path):
Path=chromePath
defconnect(lf):
=t((Path,"History"))
=()
defclo(lf):
()
defget_history(lf):
cursor=e("SELECTid,url,title,visit_countfromurls")
rows=[]
for_id,url,title,visit_countincursor:
row={}
row['id']=_id
row['url']=url
row['title']=title
row['visit_count']=visit_count
(row)
returnrows
总结
到此这篇关于python解析Chrome浏览器历史浏览记录和收藏夹数据的⽂章就介绍到这了,更多相关python解析Chrome浏览器
内容请搜索以前的⽂章或继续浏览下⾯的相关⽂章希望⼤家以后多多⽀持!
本文发布于:2023-03-16 06:41:47,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/1678920108273060.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:浏览记录.doc
本文 PDF 下载地址:浏览记录.pdf
留言与评论(共有 0 条评论) |