最近 AI 界的大新聞是 GPT-5 和谷歌的世界模型 Genie 3。然而,在無人在意的角落里,微軟悄悄把 Edge 進(jìn)化成了了 AI 瀏覽器。
上一次聽到 Edge 的消息還是 IE 正式關(guān)停的時(shí)候,Edge 作為 IE 的繼任者難免會(huì)被拿出來討論,通常沒有什么好話。
再上一次是 Edge 加入 sidebar 功能的時(shí)候,罕見地?fù)屃艘慌?Chrome 的用戶。
時(shí)至今日,Edge 的風(fēng)評(píng)似乎沒有比曾經(jīng)的 IE 好到哪里去。
都 2025 年了,居然還有瀏覽器的首頁充斥著閃爍的 MSN 資訊、天氣卡片、股市小窗口,以及永遠(yuǎn)關(guān)不掉的「熱門故事」。與此同時(shí),微軟不斷地在給 Edge 加入「無用的新功能」,讓系統(tǒng)變得越來越臃腫。
MSN,原來你沒死透|圖片來源:Edge 瀏覽器截圖
但如果你愿意再給 Edge 一次機(jī)會(huì)的話,一鍵開啟 Copilot 模式,Edge 就變成了神似 Dia 的樣子:
干凈得不像微軟出品。
這個(gè)首頁就正常多了|圖片來源:Edge 瀏覽器截圖
01
微軟,再造一遍瀏覽器
要讓 Edge 變成 AI 瀏覽器,除了要更新到最新版本之外,還需要掌握一些小小的「魔法」。然后在設(shè)置的「AI 創(chuàng)新」一欄,就可以開啟 Copilot 模式。
Copilot 模式的形態(tài)介于谷歌在 Chrome 有限 Gemini 集成,和 Manus 這樣完全的 AI 瀏覽器之間。
在 Copilot 模式下,首頁就變成了一個(gè)對(duì)話框,你可以直接用搜索引擎搜索、詢問 Copilot 或者讓它深度思考。這一點(diǎn)和其他主流的 AI 瀏覽器差別不大。
Copilot 的第二個(gè)入口在地址欄左側(cè),一顆小藥丸形狀的圖標(biāo),單擊就可以呼出,或者讓它固定在右側(cè)。
Copilot 的第二個(gè)入口在地址欄左側(cè)|圖片來源:Edge 瀏覽器截圖
官方說它可以「感知所有標(biāo)簽頁」。于是我打開了一篇論文、一份財(cái)報(bào),以及一個(gè)亞馬遜相機(jī)的搜索頁面。隨后我告訴 Copilot:「幫我總結(jié)特斯拉的財(cái)報(bào),還有這篇論文的大綱,以及我想選購一款性價(jià)比高的相機(jī)?!?/p>
一分鐘后,Copilot 分別概括了財(cái)報(bào)和論文,附上了各個(gè)價(jià)位的最 佳相機(jī),并暗示了我給出的需求并不精準(zhǔn)。
這一瞬間,我確實(shí)有一種錯(cuò)覺,有另外一顆大腦正在替我工作。
Copilot 同時(shí)分析財(cái)報(bào)和論文,并給出選購建議|圖片來源:Edge 瀏覽器截圖
這種總結(jié)能力也能遷移到視頻上。當(dāng)你在 Edge 中打開 YouTube 視頻時(shí),只要呼出 Copilot 并指示「總結(jié)視頻」,它就會(huì)給出總結(jié)。
美中不足的是,Copilot 的這種感知并非全自動(dòng)的,需要你手動(dòng) @ 標(biāo)簽欄,它才能替你工作。
不過,最能讓我產(chǎn)生「幻覺」,是 Copilot Vision。這是一個(gè)交互方式上非常新鮮的功能,Copilot 可以直接看到你的屏幕,并以此為基礎(chǔ)和你用語音交互,就像你和朋友共享屏幕一樣。
Vision 讀取屏幕,并給出建議|圖片來源:Edge 瀏覽器截圖
例如在一個(gè)典型的購物場(chǎng)景,Copilot Vission 就可以直接看到屏幕上的備選產(chǎn)品,并給出選購建議。打開 Copilot Vission,一個(gè)帶著濃郁廣普口音的中年女聲就會(huì)很熱情地和你打招呼:「嗨~我可以看到你屏幕啦!」,很像在 Panda Express 或者 Jade Dragon Restaurant 碰到的那種廣東阿姨。
不得不說,現(xiàn)在的 AI 語音已經(jīng)做得非常自然,已經(jīng)不太分辨得出 AI 味。碰到 AI 驗(yàn)證的時(shí)候,它還會(huì)主動(dòng)安慰你:
「是不是挺煩人的」。
這我還是第 一次在 AI 身上感受到了人味,語音交互帶來的情感濃度的確要比文字強(qiáng)很多。
但是就功能性來說,Vission 還算不上實(shí)用。一方面是它的圖像識(shí)別速度跟不上我的瀏覽速度。另一方面,它在圖像和語音識(shí)別的準(zhǔn)確率上也有待提升。例如它會(huì)把「IPX6」識(shí)別成「IPX4」,我用語音糾正了它,它馬上道歉,但是聽成了「IPX7」。
目前的 Vision 有一點(diǎn)像家里的女性長輩,不懂科技,聊天信息密度不高,但是非常包容,情緒價(jià)值拉滿。
以上就是 Edge 最主要的功能了。還有一些功能微軟表示正在開發(fā)中,例如 Agent 能力、智能標(biāo)簽分組或者是動(dòng)態(tài)的 AI 助手。
實(shí)際上,很多功能微軟已經(jīng)開發(fā)完畢、處于測(cè)試階段了,出于大公司的保守,它沒有集成到 Edge 中。但是沒有關(guān)系,進(jìn)入單獨(dú) Copilot 主頁,打開「實(shí)驗(yàn)室」,你可以看到,微軟確實(shí)在開發(fā)一些好玩的東西。
Copilot 實(shí)驗(yàn)室|圖片來源:Edge 瀏覽器截圖
Copilot 3D,可以一鍵將圖像轉(zhuǎn)換為 3D 模型。上傳自己的照片,你就可以輕松得到一個(gè)「逼真」的 3D 頭像。
Copilot 游戲,體驗(yàn)原汁原味的上古 FPS 大作《雷神之錘 2》,并且每一幀都是由 AI 實(shí)時(shí)生成的,同時(shí)畫面非常卡頓。
Copilot Actions 是微軟最接近「Agent」野心的功能。我試著讓它預(yù)訂了一張 8 月 10 號(hào)從上海飛北京的機(jī)票。Copilot 大概跑了 20 分鐘,完成了點(diǎn)點(diǎn)鼠標(biāo)一分鐘就能做完的工作。
但奇妙之處在于:它允許我隨時(shí)「搶方向盤」。
當(dāng)它差點(diǎn)給我選了個(gè)中轉(zhuǎn)航班時(shí),我可以隨時(shí)接管瀏覽器權(quán)限,把航線拉回直飛。這種「人機(jī)共駕」的體驗(yàn),比那些一路黑箱跑到底的競(jìng)品要安心得多。
實(shí)際上,這樣操作之后,跑任務(wù)的效率會(huì)大大提升,最終的出品也可控得多。我覺得這才是目前 Agent 最實(shí)用、最可靠的人機(jī)協(xié)作形態(tài)。正如它的名字 Copilot 一樣,這是一種副駕駛員的哲學(xué)。
用戶可以隨時(shí)暫停,接管瀏覽器 | 圖片來源:Edge 瀏覽器截圖
02
微軟的歷史包袱
總的來說,Edge 瀏覽器的 AI 進(jìn)化給到了不錯(cuò)的體驗(yàn),基礎(chǔ)功能不遜色于主流工具的同時(shí),也有一些自身的亮點(diǎn),例如標(biāo)簽感知和 Vision。
但與此同時(shí),這還不是一款可以成熟到覆蓋所有 Edge 用戶的產(chǎn)品。很多宣傳的功能并沒有完全兌現(xiàn),各個(gè)功能的入口也分散在四處。最明顯的就是,地址欄旁 Copilot 入口支持附件上傳和語音交互,而主入口的 Copilot 反而不支持這些功能。
更大的割裂感在于 Edge 瀏覽器本身和 Copilot 模式上。
單就視覺而言,傳統(tǒng)功能區(qū)延續(xù)了 Win11 的 Fluent 圓角玻璃;AI 面板則是現(xiàn)代極簡(jiǎn)的風(fēng)格,仿佛兩代人共用一張辦公桌。
兩種設(shè)計(jì)風(fēng)格同時(shí)共存在一個(gè)頁面
更重要的功能性上,Edge 團(tuán)隊(duì)背負(fù)著沉重的歷史包袱:兼容模式、IE 模式、企業(yè)策略、臃腫的 PDF 閱讀器……而 Copilot 團(tuán)隊(duì)顯然想再造一個(gè)「AI 優(yōu)先」的物種。兩股力量在同一具身體里拉扯,導(dǎo)致入口分散、菜單嵌套、選項(xiàng)重名。
于是,Edge 就像是一座仍在施工的跨河大橋:橋這頭,是微軟多年堆出來的舊公路,坑洼卻熟悉;橋那頭,是閃著霓虹的 AI 新大陸,誘人卻斷續(xù)。
用戶站在橋中間,有一些迷茫。