ChatGPT 火热起来以后,陆陆续续使用了不少和 GPT 有关的浏览器扩展,功能定位上主要围绕着几个方面:翻译、内容总结、提问和搜索等等。这些浏览器扩展,可以让用户更好地利用 ChatGPT 和 GPT 等语言模型的能力,提高工作和学习的效率。
经过一段时间的使用,结合应用场景的流畅性,沉淀下来几个值得推荐和分享的扩展:Cubox、沉浸式翻译、Perplexity、Elmo,以及无需固定在顶栏的 Raycast Companion。
1、Cubox,网页收藏,cubox.pro
Cubox 的作用主要是收藏网页稍后阅读,主要特色包括:收藏、阅读、标注、管理功能,支持共享菜单、小组件等。App 覆盖 Mac、iOS、Android、浏览器扩展,收集渠道支持微信、邮件,AI 能力体现在自动总结、自动解读关键问题、自动标注、问答和分析,还可以快速处理或筛选值得阅读的文章。
Cubox Pro 会员还可以使用邮件收藏,生成一个自己的专有邮箱,就能用来订阅网站或博客的内容更新,直接收藏到 Cubox 当中。另一个会员功能则是微信公众号的文章收藏,先将微信与 Cubox 账号绑定,微信扫码添加「Cubox 收藏助手」,最后在微信中将内容发送给「Cubox 收藏助手」即可完成收藏。
2、沉浸式翻译,英文网页浏览 沉浸式翻译
AI 驱动的双语网页翻译扩展,支持 Deepl/Google/OpenAI/有道/腾讯翻译等多个翻译服务,支持 Firefox/Chrome/油猴脚本,还可以在 iOS Safari 上使用。使用场景上默认通过快捷键(⌥A)来翻译当前网页,也可以设置按下 Control 键翻译当前鼠标指针所在的段落,或者在设置中添加「总是翻译的网址」自动翻译个别网址。
我的使用习惯是通过 Control 键翻译指定的段落,这样能减少不必要的 token 消耗。沉浸式扩展还有一个很使用的翻译功能,启用「输入框增强」,然后就能在输入框中快速连击 3 次<空格键>,直接翻译整个输入框内容为英语 (English)。
对于已经安装过 Ollama 的用户来说,还可以使用本地的语言模型来无限量的翻译。需要注意的问题是,目前 Ollama 默认允许来自 127.0.0.1 和 0.0.0.0 的跨域请求(CORS),但是应用扩展和 Ollama 之间进行互动需要额外的在命令行先运行一下 launchctl setenv OLLAMA_ORIGINS "*"
,再打开 Ollama 的主程序。
其他 OLLAMA 沉浸式扩展中的参数项填写如下图所示:
翻译服务选择 OpenAI,Apikey 填写 ollama,模型填写你已经下载到本地的模型库名称,例如:gemma、qwen:7b 等;API 接口地址填写:http://localhost:11434/v1/chat/completions
3、Perplexity,Perplexity是一个「信息」检索引擎 Perplexity - AI Companion
不同于传统的 Google、百度搜索只是罗列相关的关键词,Perplexity 会通过网络对搜索到的信息进行总结提炼并给出参考内容来源,回答的下方,Perplexity 还预测用户可能会追问的问题。
Perplexity 比搜索引擎额外多做了几件事:搜索前,Perplexity 会通过大模型,重新理解用户提出的问题,然后解析为更清晰的搜索指令,接下来,调用 Google、Bing 等搜索引擎创建相应的索引库,对所有的搜索结果做重新排序。最后,让大模型筛选出优质的内容并输出答案和相关的问题。Perplexity 让搜索结果更接近用户想要的东西,它在原有搜索引擎的基础上加入了大模型的自然语言理解,通过 AI 生成了更丰富的回答和相关内容。
Perplexity 有单独的网站,可以保存对话(需要登录)的记录。另一种方式就是安装 Chrome 扩展,以小窗口的方式查询,后者更灵活。Perplexity 扩展也提供了 Summarize(总结)功能,点击 Summarize 就能快速总结当前网页,如果输出是英文,也能直接输入用“中文对当前网页进行总结”然后重新让它总结一次。
Perplexity 免费就能使用,它利用了来自 OpenAI、Google 和 Anthropic 的 API 模型。免费计划使用的是 OpenAI GPT 3.5 模型,而 Perplexity Pro(每月20美元或每年200美元)则能使用 GPT 4、GPT 4V、Claude 2.1 和 Gemini 模型,Pro 用户能通过 Focus 选项选择特定的数据来源,包括学术写作、Wolfram Alpha、YouTube、Reddit 等,以便获得更专业的回应。
4、Elmo Elmo.Chat
Elmo 是以扩展边栏的方式来总结内容,无需 GPT/OpenAI 账号即可使用。除了总结和翻译这些点,Elmo 还能对当前页面内容进行问答交互, 你可以针对性地提出问题,Elmo 会直接从页面内容中获取答案。插件除了默认语言设置没有其他杂七杂八的东西,简约清新。
底部的输入框中,通过 / 可以切换命令:总结(summarize)、重新措辞(rephrase)、翻译(Translate)。点击橘色的⚡图标,重新生成内容。
最后再来说说 Raycast Companion 扩展,这是 Raycast 最新一次升级带来的网页总结 AI 扩展,安装后通过Raycast 中设置的快捷键来激活。
默认的英文 AI 指令总是输出英文,可以自行通过 Create Al Command 创建一个来代替。
Prompt:Please provide a concise summary in Chinese that covers the main points and information based on the {browser-tab} I provide you.
Raycast 默认使用的模型是 GPT 3.5,GPT 4 需要单独订阅 8 美元/月。实际使用中,Raycast 的不足是总结内容经常会中断,需要以继续对话的方式让它补全。另外,快捷键激活的总结窗口是单独的,失去焦点后会自动消失。 想找回刚才的总结记录,要记住好几个快捷键,多次操作才能打开 chat 历史窗口,有些繁琐和不方便。
Raycast 整合的 AI 功能一直用的不太顺,毕竟它的主要优势是整合调用各种 App 和插件,AI 只是其中的一部分,操作流畅度不太高,既有快捷键操作的递进问题、也有输入法切换的困扰、最主要的还是模型的限制,对 API 用户没那么 Open。
刚好最近关注到 Twitter 出现的一个很有潜力的新应用推广:Haye AI,专为 macOS 设计的文本智能助手,系统级支持多平台同步的 AI 工具,Haye 不仅可以在 Chrome 中运行,还可以在 macOS 上的任何应用程序中运行。预计四月底至五月初发布官方版本,感兴趣的同学可以一起加入等待名单:https://haye.ai/。