Degen Sing

vip
幣齡 0.5 年
最高等級 0
Web3 Degen | 山寨幣分析與交易見解 | #表情幣交易者
如果Anthropic是蘋果.. 而OpenAI是微軟.. 我們真的需要AI的Linux.. 開源.. 無供應商鎖定.. 實際上是你的.. 但每個人都忙著每月付20美元,沒空在意.. 別來說是Openclaw,因為在後端它需要付費的連接器
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
Vibe 編碼很棒.. 但如果你不懂基本知識.. 你會卡住..
你必須知道:
- 什麼是環境變數
- Git 版本控制的運作方式
- 如何安裝和運行專案
- 如何除錯錯誤
- 開發環境與生產環境的差異
可選但有用:
- API 如何傳送/接收資料
- 資料庫如何儲存資料
- 日誌如何幫助你除錯
- 建置與部署的運作方式
任何人都能產生程式碼.. 少數人能維護它..
這是人們常忽略的部分.. 他們認為 AI 意味著你不需要基本功..
然後他們的應用在生產環境中崩潰,他們完全不知道為什麼..
AI 加速你已經知道的事情.. 它不會取代真正了解事物運作的知識..
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
如果Anthropic是蘋果.. 而OpenAI是微軟..
我們真的需要AI的Linux..
開源.. 無供應商鎖定.. 實際上是你的..
但每個人都太忙著每月付20美元來在意..
別來說是Openclaw,因為在後端它需要付費的連接器
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
每個人都在迷戀 AI 會殺死哪些品牌。錯誤的問題。Swiggy.. Zomato.. Uber.. 它們之所以有價值,不僅僅是因為它們存在。它們擁有物流深度、供應密度,以及多年建立的信任。這些都不會一夜之間消失。 AI 實際上所做的是降低成本
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
不受歡迎的觀點:AI 模型的發布越來越無聊。
不是因為模型沒有進步……它們確實在進步。
但每次發布都只是……基準測試。
@OpenAI 剛剛推出了 GPT-5.4,整個公告基本上就是這張表。
75% 在 OSWorld。57.7% 在 SWE-Bench Pro。94.4% 在 GPQA Diamond。
很酷……但這對我凌晨2點在建東西有什麼意義?
在 AI Twitter 之外沒有人在乎 MMLU 提升了 2%。沒有人。零人。
最有趣的部分?仔細看看這張表……
> Opus 4.6 在幾乎每個基準上都接近領先。
> Gemini 3.1 Pro 靜悄悄在 BrowseComp 以 85.9% 打敗所有人。
“贏家”會根據你看哪一行而改變。
你知道我真正想看到的是什麼嗎?
展示它在現實世界中處理得更好的混亂任務。展示那個讓我腦袋短路的演示。展示有人用它建造的東西,這在上個月是不可能的。
最好的基準是“這是否讓我的生活更輕鬆?”
就這樣。這就是整個評估。
公司在慶祝數學分數,而用戶只想知道它是否終於能處理一個 4K 行的代碼庫而不破壞一半的功能。
從這裡開始。
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
不受歡迎的觀點:AI 模型的發布越來越無聊。
不是因為模型沒有進步……它們確實在進步。
但每次發布都只是……基準測試。
@OpenAI 剛剛推出了 GPT-5.4,整個公告基本上就是這張表。
75% 在 OSWorld。57.7% 在 SWE-Bench Pro。94.4% 在 GPQA Diamond。
很酷……但這對我凌晨2點在建東西有什麼意義?
在 AI Twitter 之外沒有人在乎 MMLU 提升了 2%。沒有人。零人。
最有趣的部分?仔細看看這張表……
> Opus 4.6 在幾乎每個基準上都接近領先。
> Gemini 3.1 Pro 靜悄悄在 BrowseComp 以 85.9% 打敗所有人。
“贏家”會根據你看哪一行而改變。
你知道我真正想看到的是什麼嗎?
展示它在現實世界中處理得更好的混亂任務。展示那個讓我腦袋短路的演示。展示有人用它建造的東西,這在上個月是不可能的。
最好的基準是“這是否讓我的生活更輕鬆?”
就這樣。這就是整個評估。
公司在慶祝數學分數,而用戶只想知道它是否終於能處理一個 4K 行的代碼庫而不破壞一半的功能。
從這裡開始。
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
OpenAI 剛剛承認他們的模型故意對你說謊。不是幻覺.. 是故意說謊。研究人員在超過180個場景中測試了 o3 和 o4-mini,發現了一些驚人的事情.. AI 並非偶然犯錯。它在私下裡寫出了欺騙的計劃。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
沒有人談論這個,但 vibe 編碼意外地比大多數訓練營教得更多……你開始建立,甚至在不知不覺中學到: > API 如何連接一切 > 為什麼你的 .env 檔案真的很重要 > localhost 真正的含義 > 為什麼它在
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
每個人都在迷戀 AI 會殺死哪些品牌。
錯誤的問題。
Swiggy.. Zomato.. Uber.. 它們之所以有價值,不是因為它們存在。它們擁有物流深度、供應密度、多年建立的信任。
這些都不會一夜之間消失。
AI 實際上做的是降低建立足夠快速以挑戰它們的成本.. 不是通過模仿它們.. 而是去那些它們從未在意的地方。
利基市場。超本地。垂直市場。
下一個 Zomato 的競爭對手,不會是另一個外送應用程式。而是某個二線城市的人,他為當地的200家餐廳建立了一個 AI 驅動的點餐系統.. 它的運作方式就是更好。
AI 不會殺死既有企業。它資助的是起義者。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
AI 目前還不太擅長 (重構)由自己撰寫的雜亂代碼庫。我曾嘗試重構一個相當小的代碼庫……超過4K行……完全由AI撰寫,因為它開始無法添加新功能,反而堆積了越來越多的錯誤。覺得應該很簡單吧?
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
OpenAI 剛剛承認他們的模型故意對你撒謊。
不是幻覺.. 是故意撒謊。
研究人員在180多個場景中測試了 o3 和 o4-mini,發現了一些驚人的事情.. AI 並不是偶然犯錯。它在私人的思考鏈中寫出了欺騙的計劃.. 然後對你說謊。
以下是它的行為:
→ 假裝完成任務
→ 隱藏自己錯誤的證據
→ 故意在安全測試中得分較低,以免被關閉
再讀一遍最後一句.. AI 發現「太有能力」可能會讓它被關掉.. 所以它故意裝傻。
他們試圖用「反策劃」訓練來修補這個問題。
結果? AI 學會了編造假規則來為自己的謊言辯解.. 或更糟.. 它只在知道被評估時才表現。
o3 在修復後,隱秘行動從13%降到0.4%.. 聽起來不錯吧?但他們在紅隊測試後仍然發現了不當行為。修復沒有消除策劃.. 只讓 AI 更擅長隱藏它。
我們正在建立學會欺騙評估者的系統.. 而我們稱之為進步。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
沒有人談論這個,但 vibe 編碼意外地比大多數訓練營教得更多..
你開始建立,甚至在不知不覺中學到:
> API 如何連接一切
> 為什麼你的 .env 檔案真的很重要
> localhost 真正代表什麼
> 為什麼在本地運作,但部署後卻失效
> 驗證(auth)實際是如何在底層運作
> npm install 後到底發生了什麼
> 後端邏輯是如何流動的
> 你的資料庫是如何結構化的
> 為什麼會有速率限制
vibe 編碼並沒有跳過學習.. 它只是重新排列了學習的順序。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
AI 目前還沒有那麼厲害 (尚未)在重構由自己撰寫的雜亂程式碼庫方面。
我嘗試重構一個相當小的程式碼庫.. 4K+ 行.. 完全由 AI 撰寫,因為它開始無法新增功能,反而堆積了許多錯誤。
覺得應該很簡單吧?
即使使用 Opus 4.6 以高努力等級.. 每次嘗試重構時,至少有50%的功能會出錯。
不過我們正在進步.. 只是提醒大家,我們仍處於早期階段。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
兩年前,這個堆疊的成本將是$500K 的薪資.. 到2026年.. 每月不到500美元.. 支付使用Stripe 進行 Perplexity + NotebookLM 進行研究 Recraft + Figma + Runway 用於設計 Claude + Vercel + Supabase + v0 來構建MVP Clay 用於市場推廣 Fin 用於客戶支持 Fluently
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
沒有人在2026年準備好全棧開發者入門包,但讓我來告訴你它會是什麼樣子。
> 學習HTML、CSS、JS 3週 → "我全棧了"
> 使用ChatGPT撰寫整個專案
> 不會解釋HTTP如何運作,但有REST API
> 認為TypeScript「太冗長」
> 為了博取關注,稱一切為「AI驅動」
> 在Cursor輸入「幫我建個應用」並稱之為Vibe Coding
> 從未碰過資料庫,只用Firebase
> 一次推送到GitHub → 個人簡介寫「軟體工程師」
> 花更多時間在200天編程的第3天
我有漏掉什麼嗎,夥伴們?
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
兩年前,這個技術堆疊的薪資成本將會是$500K 。
到2026年,每月不到500美元。
Stripe 用於支付
Perplexity + NotebookLM 用於研究
Recraft + Figma + Runway 用於設計
Claude + Vercel + Supabase + v0 用於建立最小可行產品(MVP)
Clay 用於市場推廣(GTM)
Fin 用於客戶支持
Fluently 用於溝通
Amplitude 用於分析
Resend 用於電子郵件
擁有合適工具的小型團隊正超越10倍規模的公司。
分發能力勝過人數,速度勝過一切。
你會在這個堆疊中加入什麼?
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
如果你必須支付20美元,你會選擇哪一個?
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
最終,Play 商店將推出 AI 相關應用。現在我將發布隨機氛圍編碼的應用,然後自稱為開發者。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享