星期四, 2月 23, 2006

SQL server 2005 的新功能(一)

這星期抽空去聽一下SQL server 2005 Data Mining的座談會 , 微軟針對資料庫這塊真的了很多工夫,其價格與功能都非常誘人, Enterprise 版本可支援的CPU、 記憶體及資料庫大小皆沒有限制 ,並支援多重核心64 位元處理器 ,在效能上有很大的突破。 再試玩過覺得比較有趣的新玩意如下:

 


1. 管理介面整合 : 這是我最不習慣的部份 , 所有的功能可以再同一個介面裡搞定 ,主要分為SQL Server Management Studio和專門處理BI的 Business Intelligence Development Studio ,  Business Intelligence Development Studio是新的開發工具 , 主要先做塑模後再發佈到DB上 ,發布後的模型 , 可以在r Management Studio上做管理及執行。


 


2. 原有的DTS 變成功能更強大的SSIS ( SQL SERVER Integration service) , 可以轉換其他異質資料庫 , 如DB2 、Oracle ,並可以透過視覺化介面 , 設計data flow 和 control flow , 來處理更複雜的資料轉換及維護作業 。


 


3. 原有的Analysis service 加入10種Data Mining演算法工具 ,分別是


決策樹  、 群集演算法,時序群集、 時間序列、線性迴歸 、羅吉斯回歸、關聯規則、類神經網路、貝式決策定理、Text Mining( English only)


透過採樣驗證後,可利用專業的Know-how去抓出隱藏的資料特徵 ,採礦的工作需要有良好的專業知識及邏輯,才能抓出符合實際的資訊。


 


4.原有的reporting  service新增了report builder 讓報表產生更有彈性


 


5. 在分析方面,加強了MDX的功能及重要性,表示DBA們要多學一樣語言


 


6.在T-SQL開發方面,整合了CLR,表示透過.NET也能寫T-SQL,但前提是要用OLe DB provider來連結DB


 


7.多了XML型別,可直接將XML document塞進資料庫


 


8.透過資料庫鏡像(Mirror)和監控(Monitor) ,可以把原來Cluster架構的回覆的時間由30秒縮短為3秒。


微軟總共提供了30種特別的改善項目 ,再此不一一提供 ,對 Data Mining 有興趣的朋友可參考Microsoft提供的資料去做分析


 






























目的演算法
交叉銷售決策樹, 類神經網路, 關聯規則, 時序群集, 貝氏決策定理,羅吉斯迴歸
顧客流失分析
決策樹, 類神經網路, 貝氏決策定理, 群集演算法,羅吉斯迴歸
顧客區隔
群集演算法, 決策樹, 關聯規則

信用評等
羅吉斯迴歸,決策樹, 類神經網路, 貝氏決策定理
詐騙分析羅吉斯迴歸,決策樹, 類神經網路, 群集演算法, 貝氏決策定理

良率分析
時序群集, 群集演算法, 類神經網路, 決策樹

顧客價值管理
時間序列, 決策樹, 類神經網路,群集演算法,線性迴歸

銷售業績預測
時間序列, 決策樹, 類神經網路, 線性迴歸

 

沒有留言: