華人藝術家掃描800萬街景畫面 打造「紐約街頭文字地圖」
華人媒體藝術家趙宇峰(Yufeng Zhao,音譯)與數據新聞記者丹尼斯(Matt Daniels)日前利用光學文字辨識(OCR)技術,掃描過去18年來的800萬張谷歌街景影像,建立起一張涵蓋紐約市的「可搜尋街頭文字地圖」。項目總共擷取約1億3800萬段文字,從店招、車貼、標語到塗鴉標記,全數標上地理座標,以貼紙、路牌、街頭塗鴉與店鋪招牌解析整座城市的「源代碼」。
該項目發表於數據藝術網站The Pudding,結合社會語言學研究與城市尋寶遊戲,該計畫同時推出互動搜尋平台AllText.nyc,讓使用者能以視覺方式瀏覽這些文字彙集。只要用戶輸入「gold(金)」、「halal(清真)」、「beware(小心)」等詞彙,都能看到各自的分布地圖,不少結果都在意料之內,例如「pizza(披薩)」在五大行政區共出現11萬1290次,「Sabrett」品牌的熱狗車幾乎遍布街頭。
另一些發現則具地理意涵,像是「luxury(奢侈)」盡管遍布全市,但在哈德遜廣場(Hudson Yards)特別密集,「iglesia(教會)」則精準標示出西語裔社區、而「jerk(肉乾)」則多數出現在牙買加餐廳門口,意為一種烤肉方式。數據中最常見的詞彙則是市政警語,包括「stop」、「no」、「do not」、「only」、「limit」等充滿限制性的詞彙主宰了紐約街景。
數據庫中也不乏和華人相關的詞彙,例如「Chinese(中文、中餐)」排名281位,「Chinese Restaurant(中餐廳)」排第510位,而「Chinese Food(中餐)」則排在第666位。就連「Flushing(法拉盛,同時也意為沖洗、臉紅)」一詞也進入了榜單,排名547。而從地圖分布來看,「法拉盛」一詞其實不僅僅來自法拉盛社區,還來自連結布碌崙(布魯克林)和皇后區的法拉盛大道(Flushing Avenue)。
盡管街景技術源於谷歌,但真正探索其潛力的是像趙宇峰這樣的獨立創作者,過去義大利藝術家Cirio就曾將谷歌街景的人物剪影打印成真人大小的貼圖,放回到當初出現的街道位置,形成一種詭異的「幽靈再現」,挑戰數據採集與隱私的邊界。
趙宇峰今年27歲,來自上海,現居布碌崙,活躍於數據可視化、影像語言處理與體驗設計領域。他曾在上海紐約大學取得互動媒體藝術與計算機科學雙學位,同時在卡內基梅隆大學取得人機互動碩士學位。

FB留言