1. 自增長(zhǎng) primary key 采用自增長(zhǎng) primary key主要是性能。早期的數(shù)據(jù)庫(kù)系統(tǒng),經(jīng)常采用某種編號(hào),比如身份證號(hào)碼,公司編號(hào)等等作為數(shù)據(jù)庫(kù)表的 primary key。然而,很快,大家就發(fā)現(xiàn)其中的不利之處。 比如早期的醫(yī)院管理系統(tǒng),用身份證號(hào)碼作為病人表的 primary key。然而,第一,不是每個(gè)人都有身份證;第二,對(duì)于國(guó)外來(lái)的病人,不同國(guó)家的病人的證件號(hào)碼并不見(jiàn)得沒(méi)有重復(fù)。因此,用身份證號(hào)碼作為病人表的 primary key是一個(gè)非常糟糕的設(shè)計(jì)?紤]到?jīng)]有醫(yī)生或者護(hù)士會(huì)刻意去記這些號(hào)碼,使用自增長(zhǎng) primary key是更好的設(shè)計(jì)。 公司編號(hào)采用某種特定的編碼方法,這也是早期的數(shù)據(jù)庫(kù)系統(tǒng)常見(jiàn)的做法。它的缺點(diǎn)也顯而易見(jiàn):很容易出現(xiàn)像千年蟲(chóng)的軟件問(wèn)題,因?yàn)楫?dāng)初設(shè)計(jì)數(shù)據(jù)庫(kù)表的時(shí)候設(shè)計(jì)的位數(shù)太短,導(dǎo)致系統(tǒng)使用幾年后不能滿(mǎn)足要求,只有修改程序才能繼續(xù)使用。問(wèn)題在于,任何人設(shè)計(jì)系統(tǒng)的時(shí)候,在預(yù)計(jì)某某編號(hào)多少位可以夠用的時(shí)候,都存在預(yù)計(jì)不準(zhǔn)的風(fēng)險(xiǎn)。而采用自增長(zhǎng) primary key 則不存在這種問(wèn)題。同樣的道理,沒(méi)有人可以去記這些號(hào)碼。 使用自增長(zhǎng) primary key另外一個(gè)原因是性能問(wèn)題。略有編程常識(shí)的人都知道,數(shù)字大小比較比字符串大小比較要快得多。使用自增長(zhǎng) primary key可以大大地提高數(shù)據(jù)查找速度。 2. 避免用復(fù)合主鍵 (compound primary key) 這主要還是因?yàn)樾阅軉?wèn)題。數(shù)據(jù)檢索是要用到大量的 primary key 值比較,只比較一個(gè)字段比比較多個(gè)字段快很多。使用單個(gè) primary key 從編程的角度也很有好處, sql 語(yǔ)句中 where 條件可以寫(xiě)更少的代碼,這意味著出錯(cuò)的機(jī)會(huì)大大減少。 3. 雙主鍵 雙主鍵是指數(shù)據(jù)庫(kù)表有兩個(gè)字段,這兩個(gè)字段獨(dú)立成為主鍵,但又同時(shí)存在。 數(shù)據(jù)庫(kù)系統(tǒng)的雙主鍵最早用在用戶(hù)管理模塊。最早的來(lái)源可能是參照操作系統(tǒng)的用戶(hù)管理模塊。 操作系統(tǒng)的用戶(hù)管理有兩個(gè)獨(dú)立的主鍵:操作系統(tǒng)自己自動(dòng)生成的隨機(jī) ID (Linux, windows 的 SID), login id。這兩個(gè) ID 都必須是唯一的,不同的是,刪除用戶(hù) test 然后增加一個(gè)用戶(hù) test, SID 不同,login id 相同。采用雙主鍵主要目的是為了防止刪除后增加同樣的 login id 造成的混亂。比如銷(xiāo)售經(jīng)理 hellen 本機(jī)共享文件給總經(jīng)理 peter, 一年后總經(jīng)理離開(kāi)公司,進(jìn)來(lái)一個(gè)普通員工 peter ,兩個(gè)peter 用同樣的 login id, 如果只用 login id 作操作系統(tǒng)的用戶(hù)管理主鍵,則存在漏洞:普通員工 peter 可以訪問(wèn)原來(lái)只有總經(jīng)理才能看的文件。操作系統(tǒng)自己自動(dòng)生成的隨機(jī) ID 一般情況下面用戶(hù)是看不到的。 雙主鍵現(xiàn)在已經(jīng)廣泛用在各種數(shù)據(jù)庫(kù)系統(tǒng)中,不限于用戶(hù)管理系統(tǒng)。 4. 以固定的數(shù)據(jù)庫(kù)、表應(yīng)付變化的客戶(hù)需求 這主要基于以下幾個(gè)因素的考慮: 4.1 大型 EPR 系統(tǒng)的正常使用、維護(hù)需要軟件廠商及其眾多的合作伙伴共同給客戶(hù)提供技術(shù)服務(wù),包括大量的二次開(kāi)發(fā)。 如果用戶(hù)在軟件正常使用過(guò)程中需要增加新的表或者數(shù)據(jù)庫(kù),將給軟件廠商及其眾多的合作伙伴帶來(lái)難題。 4.2 軟件升級(jí)的需要。 沒(méi)有一個(gè)軟件能夠讓客戶(hù)使用幾十上百年不用升級(jí)的。軟件升級(jí)往往涉及數(shù)據(jù)庫(kù)表結(jié)構(gòu)的改變。軟件廠商會(huì)做額外的程序?qū)⒃缙诎姹拒浖臄?shù)據(jù)庫(kù)數(shù)據(jù)升級(jí)到新的版本,但是對(duì)于用戶(hù)使用過(guò)程中生成的表進(jìn)行處理就比較為難。 4.3 軟件開(kāi)發(fā)的需要。 使用固定的數(shù)據(jù)庫(kù)庫(kù)表從開(kāi)發(fā)、二次開(kāi)發(fā)來(lái)說(shuō),更加容易。對(duì)于用戶(hù)使用過(guò)程中生成的表,每次查找數(shù)據(jù)時(shí)都要先查表名,再找數(shù)據(jù),比較麻煩。 舉例來(lái)說(shuō),早期的用友財(cái)務(wù)軟件用 Access 作數(shù)據(jù)庫(kù),每年建立一個(gè)新的數(shù)據(jù)庫(kù)。很快,用戶(hù)和用友公司都發(fā)現(xiàn),跨年度數(shù)據(jù)分析很難做。因此這是一個(gè)不好的設(shè)計(jì)。在 ERP 中,很少有不同的年度數(shù)據(jù)單獨(dú)分開(kāi)。一般來(lái)說(shuō),所有年份的數(shù)據(jù)都在同一個(gè)表中。對(duì)于跨國(guó)公司甚至整個(gè)集團(tuán)公司都用同一個(gè) ERP 系統(tǒng)的時(shí)候,所有公司的數(shù)據(jù)都在一起。這樣的好處是數(shù)據(jù)分析比較容易做。 現(xiàn)在大多數(shù)數(shù)據(jù)庫(kù)系統(tǒng)都能做到在常數(shù)時(shí)間內(nèi)返回一定量的數(shù)據(jù)。比如,Oracle 數(shù)據(jù)庫(kù)中,根據(jù) primary key 在 100萬(wàn)條數(shù)據(jù)中取 10 條數(shù)據(jù),與在1 億條數(shù)據(jù)中取 10 條數(shù)據(jù),時(shí)間相差并不多。 5. 避免一次取數(shù)據(jù)庫(kù)大量數(shù)據(jù),取大量數(shù)據(jù)一定要用分頁(yè)。 這基本上是現(xiàn)在很多數(shù)據(jù)庫(kù)系統(tǒng)設(shè)計(jì)的基本守則。ERP 系統(tǒng)中超過(guò) 100萬(wàn)條數(shù)據(jù)的表很多,對(duì)于很多表中的任何一個(gè),一次取所有的會(huì)導(dǎo)致數(shù)據(jù)庫(kù)服務(wù)器長(zhǎng)時(shí)間處于停滯狀態(tài),并且影響其它在線用戶(hù)的系統(tǒng)響應(yīng)速度。 一般來(lái)說(shuō),日常操作,在分頁(yè)顯示的情況下面,每次取得數(shù)據(jù)在 1-100 之間,系統(tǒng)響應(yīng)速度足夠快,客戶(hù)端基本沒(méi)有特別長(zhǎng)的停頓。這是比較理想的設(shè)計(jì)。這也是大型數(shù)據(jù)庫(kù)系統(tǒng)往往用 ODBC, ADO 等等通用的數(shù)據(jù)庫(kù)聯(lián)接組件而不用特定的速度較快的專(zhuān)用數(shù)據(jù)庫(kù)聯(lián)接組件的原因。因?yàn)橄到y(tǒng)瓶頸在于數(shù)據(jù)庫(kù)( Database) 方面(數(shù)據(jù)量大),而不在于客戶(hù)端(客戶(hù)端每次只取少量數(shù)據(jù))。 在 B/S 數(shù)據(jù)庫(kù)系統(tǒng)中,分頁(yè)非常普遍。早期的數(shù)據(jù)庫(kù)系統(tǒng)經(jīng)常有客戶(hù)端程序中一次性取大量數(shù)據(jù)做緩沖,F(xiàn)在已經(jīng)不是特別需要了,主要原因有: 5.1 數(shù)據(jù)庫(kù)本身的緩沖技術(shù)大大提高。 大部分?jǐn)?shù)據(jù)庫(kù)都會(huì)自動(dòng)將常用的數(shù)據(jù)自動(dòng)放在內(nèi)存中緩沖,以提高性能。 5.2 數(shù)據(jù)庫(kù)聯(lián)接組件的緩沖技術(shù)也在提高。 包括 ADO 在內(nèi)的一些數(shù)據(jù)庫(kù)聯(lián)接組件都會(huì)自動(dòng)對(duì)數(shù)據(jù)結(jié)果集(result set)進(jìn)行緩沖,并且效果不錯(cuò)。比較新穎的數(shù)據(jù)庫(kù)聯(lián)接組件,比如 Hibernate 也加入了一些數(shù)據(jù)結(jié)果集緩沖功能。 當(dāng)然,也有一些數(shù)據(jù)庫(kù)聯(lián)接組件沒(méi)有對(duì)數(shù)據(jù)結(jié)果集進(jìn)行緩沖,比如 JDBC Driver,不過(guò)幾年之內(nèi)情況應(yīng)該有所改觀。也有些不太成功的數(shù)據(jù)緩沖,比如 EJB 中的實(shí)體Bean,性能就不盡如人意,實(shí)體Bean數(shù)據(jù)也是放在內(nèi)存中,可能是因?yàn)檎加脙?nèi)存過(guò)多的緣故。 相對(duì)來(lái)說(shuō),今天的程序員寫(xiě)客戶(hù)端數(shù)據(jù)緩沖,能夠超過(guò)以上兩個(gè)緩沖效果的,已經(jīng)比較難了