浏览器书签bookmark转json格式，同时支持浏览器和node解析

一直使用谷歌浏览器，因为某些原因登录谷歌账号不方便，所以公司和家里的浏览器上收藏的好多书签也不能同步，以前都是直接导出来，然后自己手动导入同步。

最近打算把所有书签整理下放到自己的 blog 上维护，blog 是用 vuepress2 搭建的，里面的 markdown 页面本身也是可以直接写 html 标签的。原以为直接导出的 bookmark.html 文件直接粘贴到 md 中就能用的，还是 to young to simple，倒出来的 html 文件长这样：

和我们正常的 html 页面不太一样，所有标签名和属性名全部大写了，DT、P标签都没有结束标签，即未严格标签嵌套，直接放到 vuepress 的 md 中运行和打包都会报错的。

自己手动替换修改

首先想到的当然是看能不能直接简单修改下能解决，直接全局替换和修改下标签确实可以，直接用 vscode 全局替换下就行：

删掉第一个 DL 标签前面的代码
全局删掉所有开始 P 标签
H3 和 A 结束标签末尾加上 DT 结束标签
如果报错：Unexpected EOF in tag...删掉报错标签上除了常规属性，如 href 属性之外的其他属性
DL、DT、H3、A 标签全部替换成小写，否则 build 时会报错：TypeError: Invalid value used as weak map key

借助浏览器解析标签

借助 input 的 file 属性可以在浏览器中加载出来 bookmark.html 的文件 File 信息，也就跟我们平时实现的上传选择文件功能一样。

File 接口继承了 Blob 的方法和属性，里面有一个 text 方法，Blob.text() 方法返回一个 Promise 对象，包含 blob 中的内容，使用 UTF-8 格式编码。和 FileReader 的 readAsText() 有点类似，我们可以借助这个方法把文件里面的信息转成文本。

注意 File 对象中只存在于浏览器环境中，在 node 环境中米有，不过在 node 中我们可以直接用 fs.readFile 来读取文件内容。

思路：

先通过 File 对象读取 bookmark.html 成字符串文本
然后再将文本直接借助浏览器的 DOM 节点的 innerHTML 渲染成 html 标签，这一步浏览器会自动帮我们转成节点列表 NodeList，也不需要我们自己在额外处理标签未严格嵌套的问题
然后就可以直接遍历 NodeList 来格式化我们想要的数据了，注意书签数据在最外层的 dl 节点下

注意

生成 markdown 文件时，超链接的文字内容里带标签的话，vuepress build 编译时会报错：Compiling with vite[vite:vue] Element is missing end tag，解决方式将标签的尖括号去掉： wzxhzdk:0 ## nodejs 版本大题思路其实和浏览器版本一样，只不过解析 dom 节点我们需要借助第三方 dom 库，如 htmlparser2 ## 系统自动生成的书签json文件 Chrome 浏览器其实有自动生成的json文件，具体位置：

windows 系统 C:UsersAdministratorAppDataLocalGoogleChromeUser DataDefaultBookmarks
mac 系统 /Users/${一般是你的电脑账号名}/Library/Application Support/Google/Chrome/Default/Bookmarks

也可以直接在谷歌浏览器地址栏输入 chrome://version，会自动加载出有关谷歌浏览器的各种信息。

parse-bookmark

解析谷歌浏览器 Chrome 书签 bookmark 数据的 npm 包，同时支持浏览器版和 node 版，网页版的浏览器中打开网址直接选择导出的标签文件处理就可以了：

展开阅读全文

页面更新：2024-05-29

标签：书签浏览器嵌套节点全局属性文本标签格式文件方法

1 2 3 4 5

浏览器书签bookmark转json格式，同时支持浏览器和node解析

自己手动替换修改

借助浏览器解析标签

思路：

parse-bookmark

受蜂窝形状的启发，湖南大学这一团队设计新型电池负极

任正非的预言正在变为现实！美国三大芯片巨头开始行动了

“孙笑川吧”被指有大量侮辱女性帖文，百度：全面清查

基础研究新突破！福州大学郑仕标教授合作研究成果荣登NATURE

为什么“中国鸡”要跑去外国下蛋？

比特币稳定在28000美元以上，以太坊在加息后的反弹中上涨

科技冷战：中国能否在半导体大战中取胜？

利用充电桩App系统漏洞恶意退款3名网约车司机因盗窃被判刑

《互联网宗教信息服务管理办法》

余承东：很多车几乎天天在烧网友：这话也就老余敢说

莫名收到美团送的水杯，谨防诈骗

国产版号发布数量和节奏趋于稳定，看好游戏行业估值持续提升

数字人的崛起与人工智能的发展

前所未有的聪明与干净，扫拖机器人王者石头G20深度使用

裁员潮蔓延！IT外包和咨询巨头埃森哲宣布裁员1.9万人

爷爷用好玩的方法，让才5岁的孙女，半个月时间学会200多个

谷歌开发客户方法大全（超详细的实战教程）

用好“马赛克方法” 一对一倾听幼儿

UC浏览器，逃过3·15是你的幸运

为什么不在早上试试这个方法来释放一天的工作压力？

美食推荐：富贵羊肉煲、百香果鸡爪、金汤鹿茸菌浸猪肚制

另一个角度解读中央文件，对我国税收贡献最大的省份你意

慢性咽炎的诱因及预防方法

保护胃部有哪些方法？速转养胃指南！

苹果用户反馈macOS 13.3 Beta版本已修复SMB无法共享文