麥哲倫鏟球神秘的質子自旋

麥哲倫鏟球神秘的質子自旋:

麥哲倫搶斷神秘的質子自旋

2011年7月28日 |標籤:加速器科學數據傳輸ESnet麥哲倫

琳達武,lvu@lbl.gov,+1 510 486 2402

在STAR實驗的探測器記錄衰減的亞原子粉碎起坐,以揭開的基本構建塊宇宙的工作。

是什麼讓一個質子的自旋?這是一個最大的奧秘在物理學。雖然研究人員並不完全了解的基礎物理學的這種現象,他們知道,它有利於穩定的宇宙,磁場的相互作用,是一個重要組成部分的技術,如磁共振成像(MRI)設備,用於在醫院周圍全球。

為了解開這個謎,研究人員正在粉碎一起極化質子束在相對論重離子對撞機(RHIC)在布魯克海文國家實驗室(BNL)國際合作,包括科學家從勞倫斯伯克利國家實驗室(伯克利實驗室)核科學部,經營在STAR實驗。STAR,這代表螺線管追踪器在RHIC,採用精美的靈敏探測器記錄數據對亞原子碎片這些粉碎起坐留下。隨著可能性的一個重要收益,科學家們希望這些數據進行分析,盡快。但經過五個月的數據收集,一些研究人員必須再等10個月脫機處理,以完成探測器的校準,重建和分析。因此,它可能是一年多前,他們看到了全面的分析這些實驗。據杰羅姆Lauret,軟件和計算領導人的STAR實驗在BNL,等待了一年半的時間獲得實驗分析是一個巨大的挫折研究生工作在他們的論文,更不用說研究人員誰需要的數據,以進一步自己的研究。這是其中一個原因是渴望探索合作的新計算模式的優勢。Lauret和他的一些同事認為雲計算環境下這樣大的實驗模型。



所以,當國家能源研究科學計算中心(NERSC)在伯克利實驗室和領導計算設施(ACLF)在阿貢國家實驗室收到復甦法案資金,成立兩個聯合雲計算測試平台,STAR研究人員是第一批“測試驅動器“的系統。該測試平台,被稱為麥哲倫項目建成,以研究是否可以虛擬集群具有成本效益和能源效益的科學範式。兩者都是由IBM的iDataPlex集群,允許用戶安裝自己的操作系統和軟件堆棧的虛擬機(VM)。虛擬機是一個軟件環境,執行程序就像一台物理機器,迫切需要應用的科學家是誰想要微調為特定的計算機上運行的環境,不同類型的系統。商業雲往往分佈在世界各地傳播負載和增益的可靠性。麥哲倫項目模擬這一想法與兩個站點。

質子自旋危機

所有的基本粒子有旋轉,或內在的角動量。雖然質子是一個基本組成部分的原子,其中包括幾乎所有的可見物質,它們不是真正的基本粒子,因為它們可以進一步細分。事實上,質子由三個夸克膠子結合在一起。直到25年前,研究人員認為,質子的自旋可以計算只需添加了自旋態的夸克組成。但在實驗進行的80年代末證明,只有部分的質子的自旋來自夸克。這啟示引發了“質子自旋危機”。

揚 Balewski,一個麻省理工學院(MIT)的成員,STAR合作,正在尋找這個“失踪質子自旋”使用W -玻色子的事件產生 1%的質子 - 質子碰撞記錄 RHIC的STAR探測器今年。科學家在STAR懷疑這些事件可能是關鍵,以了解有多少自旋是由其他基本粒子,夸克像大海,這是夸克 - 反夸克對的存在,並立即彈出到消滅對方。雖然它們的存在只是簡單地在一個質子,有的認為海夸克可能也有助於質子的自旋。

他說:“可見物質組成的宇宙主要由質子樣顆粒。如果我們的實驗結果導致我們的理解修訂的質子構成,這會影響我們如何描述宇宙中可見物質,說:“Balewski。

STAR實驗在麥哲倫雲

麥哲倫試驗台在伯克利實驗室的NERSC(如圖所示),其對應的是IBM的iDataPlex ALCF集群,使用戶可以安裝自己的操作系統和軟件的虛擬機。

在一個理想世界中,Balewski指出,STAR試驗將幾乎實時事件處理。對於校準,這將使 MIT的研究小組發現某些預期特徵來測量 W事件和決定,所有的探測器組件工作,或找出問題,需要加以固定。然而,這種類型的處理所有的STAR數據需要不斷地獲得約 10000 CPU核心。鑑於只有4400的CP​​U在BNL可向STAR的合作,其中一半是通常用於數據生產,這將是不可能的。如NERSC中心和ALCF有很多更多的內核,但工作等待隊列來安排。

除了提供更多的計算能力,Lauret指出,雲計算的間接幫助 STAR實驗所激勵學生開始工作早前校準任務。“雲計算使得我們的工作是”人類理解的時間框架,“他說。“在這樣的W玻色子的工作,我看到學生們非常積極努力的校準任務,知道他們可以開始他們的論文在數月內而超過 150年後。這是一個真正改變遊戲規則和模式的轉變為我們的科學界。“

作為一個例子,他列舉了麻省理工學院的研究生馬修沃克誰是如此興奮的想法的使用雲計算資源為自己的論文工作,願意做腿部工作,建立初步STAR VM亞馬遜的EC2幾年前。此後,積極進取的學生已經轉向大規模加工預包裝之星虛擬機。事實上,學生們非常投入在運行麥哲倫。他也承認美國印第安納大學的研究生賈斯汀史蒂文斯誰“夜以繼日”修改的W分析代碼在STAR船民產生有意義的結果,從事件採取的前一天,以及作為一個團隊的專用檢測和校準專家。

“雲計算使得我們的工作在人類可理解的時間框架,” - 杰羅姆 Lauret,軟件和計算導致的STAR實驗。

據謝恩佳能,誰負責 NERSC的技術集成集團,W -玻色子的分析和數據處理是一個理想的項目運行在麥哲倫雲計算實驗平台,因為它一旦軟件被打包成一個虛擬機實例,它可以運行於任何雲平台。在天星的工作分析還需要很少溝通,使他們能夠擴散到整個分佈式雲基礎設施。因此NERSC提供的STAR協作 20八核心節點就可以了麥哲倫測試平台,以“實驗”在雲環境。此優惠最終補充同等資源的ALCF的麥哲倫系統。

有了這個優惠,團隊領導的一個計算 Balewski和Lauret改編 W -玻色子的工作流程麥哲倫。其中合作者是伯克利實驗室的Doug奧爾森,長期明星隊成員,曾與誰 NERSC的Iwona Sakrejda建立VM圖像反映了STAR重建和分析工作流程在中心的現有 PDSF集群。PDSF優化處理數據密集型的科學項目,同時使用網格技術的遠程作業提交和數據傳輸。除了Sakrejda,伯克利實驗室的Lavanya Ramakrisnan還幫助球隊產卵的計算和監督他們的虛擬機。

這一合作導致了一個實時的基於雲的數據處理系統,使數據處理過程中所得的五個月的實驗和成品在幾乎相同的時間。這個隊利用點播資源,自定義腳本來自動化和優化工作流程。每30分鐘兩個獨立的進程在BNL檢查 STAR協作的計算集群的新文件。阿星簇之間的連接在BNL和NERSC的數據傳輸節點(DTNs),這是優化廣域網傳輸,然後通過建立Globus的在線。在能源部的能源科學網絡(ESnet)進行數據加州,一旦到達 NERSC,數據“停泊”在中心的全局文件系統,直到它被用於一個虛擬機。

“停車數據對全球從頭給了我們一個 20兆兆字節的緩衝區之間的網絡和虛擬機。這最大化了科學的工作流程,確保數據提供給虛擬機在任何時候,沒有閒置的處理器,說:“Sakrejda。

STAR數據進行到NERSC從 BNL通過能源科學網絡(ESnet)

一旦完成數據處理,結果被備份在NERSC的海量存儲系統,整個社會能夠即時訪問 STAR它通過它的計算資源,PDSF。副本所分析的事件也送回BNL永久存檔。麥哲倫測試平台在NERSC是基於流行的開源 Eucalyptus雲軟件,而ACLF測試平台運行 OpenStack軟件和雨雲 Tookit,後 W -玻色子的團隊成功地推出了各自的圖像上桉樹,奧爾森曾與工作人員在阿貢來調整圖像上運行的其他平台。目前運行的明星隊連貫集群超過 100虛擬機從三個麥哲倫資源池 - 桉樹在NERSC,雨雲在ANL和OpenStack在ANL。總數已超過 800核心,他們希望越過門檻 1000並行作業的到來。

“星的合作一直使用網格資源相當一段時間,有一個夢想的運行數據處理大量的資源在全國各地。但最大的挑戰之一,已獲得 STAR軟件運行在所有的這些網站和維護它,說:“奧爾森。“在雲中,我們可以驗證一台機器上的形象和小的調整有一堆網站運行它。”

除了實時 W事件的分析,STAR合作還處理了大樣本的金金事件對麥哲倫測試平台。“幾個星期前年底到2011年的數據,我們的團隊被告知,如果我們處理的事件採取了幾個星期前,初步結果表明,RHIC將放棄原定探測器測試,以使我們能夠繼續碰撞金梁研究夸克膠子等離子體,說:“Lauret。“這是前所未有的。RHIC實際上改變了運行計劃的基礎上離線分析獲得的數據在同一年。我們沒有能夠做到這一點無雲的資源。“

科學雲:經驗教訓

除了科學成就,其中一個主要教訓是,從本實驗建立一個虛擬的形象是一個很大的概念更容易比​​現實。

“建立一個虛擬機是不是一個典型的科學家,我認為可以這樣做,你需要很多的系統管理員技能,”奧爾森說。“隨著我的先進計算的背景,它是兩個或3週學習行使我把我大約兩到三週的時間建立一個對這些系統從無到有,幾天來適應圖像上運行的雲彩在ACLF。”

“所有的道格的工作是值得的,因為現在我們可以運行在多個地方與信心的分析結果,補充說:”Lauret。

“到目前為止,我們已經使用了雲環境來卸載峰值運算的需求,在這方面已經制定了非常好,但運行這些圖像不是一個交鑰匙的操作,說:”Balewski。“由於我們正在加速這種努力的還有很多手工參與,這是不容易的。在這個計算實驗是非常有幫助的工作與 Iwona因為她一直幫助我們運行 PDSF多年,她明白我們的科學,具體計算要求STAR分析,沒有太多的解釋。“

據 Sakrejda,其他兩個問題需要考慮建立虛擬機時,圖像的大小和安全性。她指出,形象的創造者必須非常小心,不要危及安全的虛擬機所留下的個人信息,如密碼或用戶名。開發人員還需要使圖像盡可能完整,但也很小,因為它駐留在內存中。“大小的圖像將採取遠離內存可用於應用程序,”她說。

“在這種情況下的研究中,STAR合作利用了現有的基礎設施真正的NERSC,ACLF和ESnet上運行的雲。從這個工作中,我們了解到,科學的雲計算不僅僅是有關數據處理。這是一個整體環境,包括存儲,廣域網和局域網傳輸,安全性和科學軟件諮詢支持,說:“佳能。“星示範真正說明了權力的擁有可帶來額外的計算負擔上出了問題,並且有一個整體的生態系統,是需要做出的貢獻。”

這個故事被改編從ISGTW文章寫的儀恩賜


關於NERSC和伯克利實驗室
的國家能源研究科學計算中心(NERSC)是主要的高性能計算設施的科研贊助由美國能源部科學辦公室。位於勞倫斯伯克利國家實驗室,NERSC中心提供了4000多科學家在國家實驗室和大學的研究範圍廣泛的問題,在燃燒,氣候模擬,核聚變能源,材料科學,物理學,化學,計算生物學等學科。伯克利實驗室是美國能源部伯克利國家實驗室位於加利福尼亞州。它進行非保密科學研究和管理是由加州大學為美國能源部科學辦公室。如需有關計算科學伯克利實驗室,請訪問www.lbl.gov / CS

'via Blog this'

留言