標簽:法律法規
國家知識產權局局長令
第十五號
根據中國專利行業標準在制定中要為社會公眾服務、為國家宏觀決策服務、為行業管理部門管理服務的指導思想,依據專利法實施細則第18條第4款的規定,特制定《核苷酸和/或氨基酸序列表和序列表電子文件標準》,現予公布,自二○○一年十一月一日起施行。
局 長 王景川
二○○一年十一月一日
ZC
中華人民共和國知識產權行業標準
ZC 0003—2001
核苷酸和/或氨基酸序列表
和序列表電子文件標準
2001-11-01發布 2001-11-01實施
中華人民共和國國家知識產權局 發布
核苷酸和/或氨基酸序列表和序列表電子文件標準
1 總則
根據專利法實施細則第18條第4款的規定,包含一個或多個核苷酸或者氨基酸序列的發明專利申請,說明書中應當包括符合國家知識產權局專利局規定的序列表,并按照國家知識產權局專利局的規定提交含有該序列表的計算機可讀形式的副本。
為了使提交的紙件形式的核苷酸和/或氨基酸序列表及計算機可讀形式的含有該序列表的電子文件規范化,以利于申請人提交;也為了使序列表電子文件可以快捷地輸入國家知識產權局專利局的計算機數據庫,并與其它的序列檢索數據庫交換數據,以利于公眾檢索;同時也利于專利局審查員加快審查,更好地為申請人服務;特制定本標準。
2 適用范圍
本標準適用于所有向國家知識產權局專利局提交的包含核苷酸和/或氨基酸序列的發明專利申請,具體地說,適用于該申請提交的紙件形式的核苷酸和/或氨基酸序列表,以及含有核苷酸和/或氨基酸序列表的計算機可讀形式的序列表電子文件。
3 術語和定義
在本標準中,采用下面術語和定義:
(1)序列表:是指以紙件形式提交的專利申請說明書的一部分,它公開了核苷酸和/或氨基酸序列的詳細內容和其它有用信息。序列表中的序列是不少于10個核苷酸的非支鏈核苷酸序列,或者是不少于4個氨基酸的非支鏈氨基酸序列。所述的序列不包括支鏈序列;不包括具有少于4個特別定義的核苷酸或氨基酸的序列;也不包括含有列于附錄1之表1-4以外的核苷酸或氨基酸的序列。
(2)序列表電子文件:是指包含核苷酸和/或氨基酸序列表的計算機可讀形式的純文本文件。
(3)核苷酸:只包括附錄1之表1中列出的符號所表示的核苷酸。附錄1之表2中列出的符號用于表述核苷酸的修飾形式,例如甲基化堿基。對于核苷酸的修飾形式,不得在核苷酸序列中直接使用表2中的符號表示,其具體的表述方式見本標準4.4.7節(1)和4.4.5節的內容。
(4)氨基酸:只包括列于附錄1之表3中的存在于天然蛋白質中的L-氨基酸,不包括D-氨基酸。附錄1之表4中列出的符號用于表述氨基酸的修飾形式,例如羥基化或糖基化形式。對于氨基酸的修飾形式,不得在氨基酸序列中直接使用表4中的符號表示,其具體的表述方式見本標準4.4.7節(2)和4.4.5節的內容。
(5)序列標識符:對應于序列表中每個序列的序列標識號的唯一的正整數。
(6)數字標識符:由尖括號<>括起來的代表特定內容數據項的三位數字。
4 序列表和序列表電子文件中的數字標識符、內容及其格式:
在核苷酸和/或氨基酸序列表和序列表電子文件中,應當有本標準中指出的數字標識符,在數字標識符之后(即在其之右,必要時還包括在其下面的若干行)是相應的具體內容,它們應當符合本標準規定的格式。附錄2給出了一個說明數字標識符、其后內容及格式的序列表樣例。
序列表和序列表電子文件中包括的數字標識符及相應內容和格式具體如下:
4.1、序列表和序列表電子文件中的著錄項目:
下面4.1.1-4.1.7節中的內容應當與專利申請請求書中的相應內容一致。
4.1.1、申請人的姓名或名稱:其數字標識符為
在數字標識符
外國申請人還應當在中文譯名之后注明英文姓名或名稱,并將其用圓括號括起來。
4.1.2、發明名稱:其數字標識符為
在數字標識符
4.1.3、案卷參考號:其數字標識符為
在數字標識符
4.1.4、專利申請號:其數字標識符為
對于首次提交的專利申請,無需包括此項內容;當補交或提交修改時,在數字標識符
4.1.5、專利申請日:其數字標識符為
對于首次提交的專利申請,無需包括此項內容;當補交或提交修改時,在數字標識符
4.1.6、優先權號:其數字標識符為
沒有優先權的專利申請,無需包括此項內容;如果有優先權的話,那么在數字標識符
4.1.7、優先權日:其數字標識符為
沒有優先權的專利申請,無需包括此項內容;如果有優先權的話,那么在數字標識符
4.2、序列表電子文件的軟件版本信息:其數字標識符為
當使用國家知識產權局專利局或其它專利組織(例如歐洲專利局)提供的軟件形成核苷酸和/或氨基酸序列表電子文件時,在數字標識符
4.3、序列表中序列的個數:其數字標識符為
在數字標識符
4.4、序列中的各項內容:
4.4.1、序列標識符:其數字標識符為
在序列表中,每個序列應當有獨立的、唯一的序列標識符,它應當從1開始并逐一增加。序列標識符表示每個序列在序列表中的序號。
在數字標識符
在一個序列標識符之后到下一個序列標識符之前是該序列的各項具體內容,即下面4.4.2-4.4.7節的內容。
在序列表中有多個序列的情況下,應當按照序列標識符數值從小到大的次序逐一填寫每個序列的各項內容。
4.4.2、序列的長度:其數字標識符為
在數字標識符
4.4.3、序列的類型:其數字標識符為
在數字標識符
4.4.4、生物體:其數字標識符為
在數字標識符
4.4.5、序列中特征部分的內容:數字標識符
本節涉及到序列中與特征相關的內容的表述。
在核苷酸序列(數字標識符< 400> )中含有“n”或修飾的堿基的情況下(參見本標準4.4.7節(1)的內容),或者在氨基酸序列(數字標識符< 400> )中含有“Xaa”或修飾的氨基酸或不常用的L-氨基酸的情況下(參見本標準4.4.7節(2)的內容),必須包括下面(1)-(4)項的內容。
在生物體(數字標識符< 213> )是“人工序列”或“未知”的情況下,必須包括下面(1)和(4)項的內容。
在一個序列中有多個特征的情況下,應當按照這些特征在序列中出現的先后次序逐一地表述每個特征。
序列中特征部分的具體內容和數字標識符如下:
(1)特征:其數字標識符為
在數字標識符
(2)名稱/關鍵詞:其數字標識符為
在數字標識符
(3)位置:其數字標識符為
在數字標識符
(4)其它信息:其數字標識符為
在數字標識符
4.4.6、出版公開信息:數字標識符
出版公開信息是非強制性的內容,在序列表和序列表電子文件中,可以包含也可以不包含這些內容。
(1)公開出版信息:其數字標識符為
在數字標識符
(2)作者:其數字標識符為
在數字標識符
(3)題目:其數字標識符為
在數字標識符
(4)雜志名稱:其數字標識符為
在數字標識符
(5)公開出版物的卷號:其數字標識符為
在數字標識符
(6)公開出版物的出版號:其數字標識符為
在數字標識符
(7)頁碼:其數字標識符為
在數字標識符
(8)出版日期:其數字標識符為
在數字標識符
(9)公開出版物的數據庫登記號:其數字標識符為
如果該文獻被收入某個數據庫的話,那么在數字標識符
(10)錄入數據庫的日期:其數字標識符為
如果該文獻被收入某個數據庫的話,那么在數字標識符
(11)專利公開號:其數字標識符為
如果該公開出版物是專利文獻的話,那么在數字標識符
(12)專利申請日:其數字標識符為
如果該公開出版物是專利文獻的話,那么在數字標識符
(13)專利公開日:其數字標識符為
如果該公開出版物是專利文獻的話,那么在數字標識符
4.4.7、核苷酸序列和/或氨基酸序列:其數字標識符為
在數字標識符
該序列可以是純核苷酸序列,或者是純氨基酸序列,或者是核苷酸序列和與它對應的氨基酸序列。
(1)純核苷酸序列:
核苷酸序列應當只用單鏈表示,從左到右是5’-末端至3’-末端的方向,序列中不應當出現術語5’和3’。
應當用單字母代碼表示核苷酸序列的堿基來表述核苷酸序列的特征;只能使用與附錄1之表1中給出的符號相一致的小寫字母來表示。
在一個核苷酸序列中,如果經修飾的堿基是附錄1之表2中列出的之一,那么在該序列本身中,應當用未修飾的堿基或“n”來表示該經修飾的堿基,符號“n”等同于唯一的一個未知的或經修飾的核苷酸;但在該序列的特征部分(數字標識符
核苷酸序列中堿基的編號開始于序列中的第1個堿基,并從5’到3’方向連續地計數。該計數方法也用于構型為環狀的核苷酸序列,在這種情況下,申請人可任意指定序列的第一個核苷酸。
來自大序列的一個或更多非鄰接區段或來自不同序列的區段組成的核苷酸序列,應當作為帶有單獨序列標識符的單獨序列來計數。帶有一個缺口或多個缺口的序列應當作為帶有單獨序列標識符的多個單獨序列來計數,而單獨序列的數目與序列數據的連續序列的數目相同。
核苷酸序列每行最多60個核苷酸堿基,每10個核苷酸堿基后空一格。該行的最后是該行最后一個堿基的編號。
(2)純氨基酸序列:
對于氨基酸序列,蛋白質或肽序列中的氨基酸應當從左到右以氨基到羧基的方向列出;序列中不應當出現氨基或羧基基團。
氨基酸應當使用與附錄1之表3中的符號相一致的、第一個字母大寫的三字母符號表示。有空白或內部中止符號(例如“Ter”或“*”或“·”)的氨基酸序列不應當表示為單個氨基酸序列,而應當作為獨立的氨基酸序列分別列出。
在一個氨基酸序列中,如果經修飾的氨基酸是附錄1之表4中列出的氨基酸之一,那么在該序列本身中,應當用相應的未經修飾的氨基酸或“Xaa”來表示該經修飾的和不常用的氨基酸,符號“Xaa”等同于唯一的一個未知的或經修飾的氨基酸;但在該序列的特征部分(數字標識符
氨基酸的編號開始于序列中的第1個氨基酸,以數字1表示并標注在該氨基酸的下面;以后每隔5個氨基酸在其下面標注上該氨基酸的編號。當成熟蛋白質之前存在氨基酸時,例如對于前-序列,原-序列,前-原-序列和信號序列而言,可以任選地從與成熟蛋白第一個氨基酸相鄰的氨基酸開始以負數往回編號。當氨基酸編號使用負數以區分成熟蛋白質時,不得使用數字0。上述氨基酸序列的計數方法也適用于環狀構型的氨基酸序列,申請人可以任意指定第一個氨基酸。
來自大序列的一個或更多非鄰接區段或不同序列的區段組成的氨基酸序列,應當作為具有單獨序列標識符的單獨序列來計數。具有一個缺口或多個缺口的序列應當作為具有單獨序列標識符的多個單獨序列來計數,單獨序列的數目與序列數據的連續序列的數目相同。
氨基酸序列每行最多16個氨基酸,每個氨基酸之間空一格。
(3)核苷酸序列和與它對應的氨基酸序列:
對于核苷酸序列和與它對應的氨基酸序列,對應于其編碼的氨基酸的核苷酸序列的堿基應當以“三聯體”密碼子列出,每個密碼子之間應當空一格;對應于核苷酸序列的編碼部分的氨基酸可以直接列于相應密碼子的下方;對于該氨基酸序列,應當在第一個氨基酸的下面標注上編號1,然后每隔5個氨基酸在其下面標注上該氨基酸的編號。
對于這種核苷酸和其編碼的氨基酸序列的混合形式,與核苷酸序列相對應的氨基酸序列還應當以純氨基酸序列的形式另外給出。
4.5 數字標識符連同其后內容的排列格式
在本節中,“數字標識符及內容”指的是數字標識符連同其后的相應內容。
數字標識符及內容應當按照數字標識符的數值從小到大的次序排列在序列表中。
每個數字標識符及內容之間應當空一行,不過在前兩位數字相同的數字標識符及內容之間,例如
對于序列表中有多個序列的情況,數字標識符及內容應當按照序列標識符的數值從小到大的次序排列。在每個序列中,應當按照數字標識符數值從小到大的次序列出僅僅與該序列有關的數字標識符及內容,即排列上從
對于一個序列中有多個特征的情況,應當按照這些特征在序列中出現的先后次序逐一排列從
5、序列表電子文件的格式
5.1、序列表電子文件是一個包含上述第4部分的數字標識符和內容,并符合上述第4部分格式要求的純文本文件;該文件應當使用中華人民共和國頒布的信息交換用漢字編碼字符集標準。
5.2、序列表電子文件應當記錄在CD-ROM光盤或3.5英寸軟盤上提交,或者按照國家知識產權局專利局規定的其它形式提交。當記錄在CD-ROM光盤上時,該CD-ROM光盤應當采用ISO9660標準刻錄;當記錄在3.5英寸軟盤上時,該軟盤應當符合FAT 12格式。該光盤或軟盤的目錄結構如下:在根目錄下,有且僅有一個后綴名為“.SEQ”的純文本文件。
6 其它事項
6.1、申請人應當保證提交的計算機可讀形式的序列表電子文件中的內容與紙件形式的序列表完全相同。
6.2、申請人在形成符合本標準的序列表電子文件時,可以使用國家知識產權局專利局提供的序列表編輯軟件來形成;也可以使用其它專利組織提供的軟件(例如歐洲專利局提供的Patentin)來形成;還可以使用任何純文本文件編輯軟件來形成。無論使用何種軟件,所形成的電子文件都必須符合本標準的規定。
6.3、當申請人以光盤或軟盤的形式提交序列表電子文件時,應當在提交的光盤或軟盤上貼有永久性標記,注明申請人姓名或名稱、發明名稱、光盤或軟盤中的文件名和提交日期;申請人委托了代理人的,也可以任選地標注上代理機構給該申請的案卷號。對于申請人補交或提交修改的情況,應當注明申請號并注明“補交”或“修改”。
注明申請人姓名或名稱等項內容時,應當使用本標準中的數字標識符,即應當標注上數字標識符,并在其后注明具體內容,例如:
當序列表電子文件的字節數太大不能記錄在一張軟盤上時,應當將序列表電子文件記錄在一張光盤上提交。
7 頒布和實施
本標準由中華人民共和國國家知識產權局頒布,自2001年11月1日起實施。
中華人民共和國國家知識產權局
二OO一年十一月一日
附:歐洲專利局的Patentin軟件,點擊下載(文件為zip壓縮)
附錄1核苷酸和氨基酸符號和特征關鍵詞表
表1 核苷酸表
符號 | 含義 | 名稱的來源 |
a | A | 腺嘌呤 |
g | G | 鳥嘌呤 |
c | C | 胞嘧啶 |
t | T | 胸腺嘧啶 |
r | g或a | 嘌呤 |
y | t/u或c | 嘧啶 |
m | a或c | 氨基 |
k | g或t/u | 酮基 |
s | g或c | 弱作用 3H鍵 |
w | a或t/u | 強作用 2H鍵 |
b | g或c或t/u | 非a |
d | a或g或t/u | 非c |
h | a或c或t/u | 非g |
v | a或g 或c | 非t,非u |
n | a或g或c或t/u,未知,或其它 | 任何 |
表2 經修飾的核苷酸表
符號 | 含義 |
ac4c | 4-乙酰胞苷 |
chm5u | 5-(羧羥甲基)尿苷 |
cm | 2'-O-甲基胞苷 |
cmnm5s2u | 5-羧甲基氨甲基-2-硫代尿苷 |
cmnm5u | 5-羧甲基氨甲基尿苷 |
d | 二氫尿苷 |
fm | 2'-O-甲基假尿苷 |
gal q | β,D-半乳糖Q核苷 |
gm | 2'-O-甲基鳥苷 |
i | 肌苷 |
i6a | N6-異戊烯基腺苷 |
mla | 1-甲基腺苷 |
mlf | 1-甲基假尿苷 |
mlg | 1-甲基腺苷 |
mli | 1-甲基肌苷 |
m22g | 2'2-二甲基腺苷 |
m2a | 2-甲基腺苷 |
m2g | 2-甲基鳥苷 |
m3c | 3-甲基胞苷 |
m5c | 5-甲基胞苷 |
m6a | N6-甲基腺苷 |
m7g | 7-甲基鳥苷 |
mam5u | 5-甲基氨基甲基尿苷 |
mam5s2u | 5-甲氧基氨基甲基-2-硫代尿苷 |
man q | β,D-甘露糖Q核苷 |
mcm5s2u | 5-甲氧基羰基甲基-2-硫代尿苷 |
mcm5u | 5-甲氧基羰基甲基尿苷 |
mo5u | 5-甲氧基尿苷 |
ms2i6a | 2-硫代甲基-N6-異戊烯基腺苷 |
ms2t6a | N-((9-β-D-呋喃核糖基-2-硫代甲基嘌呤-6-Yl)氨基甲酰)蘇氨酸 |
mt6a | N-((9-β-D-呋喃核糖嘌呤-6-yl)N-甲基氨基甲酰)蘇氨酸 |
mv | 尿苷-5-氧化乙酸-甲基酯 |
o5u | 尿苷-5-氧化乙酸 |
osyw | Wybutoxosine |
p | 假尿苷 |
q | Q核苷 |
s2c | 2-硫代胞苷 |
s2t | 5-甲基-2硫代尿苷 |
s2u | 2-硫代尿苷 |
s4u | 4-硫代尿苷 |
t | 5-甲基尿苷 |
t6a | N-((9-β-D-呋喃核糖嘌呤-6-基)-氨基甲酰)蘇氨酸 |
tm | 2'-O-甲基-5-甲基尿苷 |
um | 2'-O-甲基尿苷 |
yw | Wybutosine |
x | 3-(3-氨基-3-羧基-丙其)尿苷,(acp3)u |
表3 三字母表示的氨基酸表
符號 | 含義 |
Ala | 丙氨酸 |
Cys | 半胱氨酸 |
Asp | 天冬氨酸 |
Glu | 谷氨酸 |
Phe | 苯丙氨酸 |
Gly | 甘氨酸 |
His | 組氨酸 |
Ile | 異亮氨酸 |
Lys | 賴氨酸 |
Leu | 亮氨酸 |
Met | 蛋氨酸 |
Asn | 天冬酰酸 |
Pro | 脯氨酸 |
Gln | 谷氨酰胺 |
Arg | 精氨酸 |
Ser | 絲氨酸 |
Thr | 蘇氨酸 |
Val | 纈氨酸 |
Trp | 色氨酸 |
Tyr | 酪氨酸 |
Asx | 天冬氨酸或天冬酰胺 |
Glx | 谷氨酸或谷氨酰胺 |
Xaa | 未知或其它 |
表3 三字母表示的氨基酸表
符號 | 含義 |
Ala | 丙氨酸 |
Cys | 半胱氨酸 |
Asp | 天冬氨酸 |
Glu | 谷氨酸 |
Phe | 苯丙氨酸 |
Gly | 甘氨酸 |
His | 組氨酸 |
Ile | 異亮氨酸 |
Lys | 賴氨酸 |
Leu | 亮氨酸 |
Met | 蛋氨酸 |
Asn | 天冬酰酸 |
Pro | 脯氨酸 |
Gln | 谷氨酰胺 |
Arg | 精氨酸 |
Ser | 絲氨酸 |
Thr | 蘇氨酸 |
Val | 纈氨酸 |
Trp | 色氨酸 |
Tyr | 酪氨酸 |
Asx | 天冬氨酸或天冬酰胺 |
Glx | 谷氨酸或谷氨酰胺 |
Xaa | 未知或其它 |
表4 經修飾的和不常用的氨基酸表
符號 | 含義 |
Aad | 2-氨基已二酸 |
bAad | 3-氨基已二酸 |
bAla | β一丙氨酸,β一氨基丙酸 |
Abu | 2-氨基丁酸 |
4Abu | 4-氨基丁酸,哌啶酸 |
Acp | 6-氨基已酸 |
Ahe | 2-氨基庚酸 |
Aib | 2-氨基異丁酸 |
bAib | 3-氨基異丁酸 |
Apm | 2-氨基庚二酸 |
Dbu | 2,4二氨基丁酸 |
Des | 賴氨素 |
Dpm | 2,2'-二氨基庚二酸 |
Dpr | 2,3-二氨基丙酸 |
EtGly | N-乙基甘氨酸 |
EtAsn | N-乙基天冬氨酸 |
Hyl | 羥基賴氨酸 |
aHyl | 別-羥基賴氨酸 |
3Hyp | 3-羥基脯氨酸 |
4Hyp | 4-羥基脯氨酸 |
Ide | 異賴氨素 |
aIle | 別-異亮氨酸 |
MeGly | N-甲基甘氨酸,肌氨酸 |
MeIle | N-甲基異亮氨酸 |
MeLys | 6-N-甲基賴氨酸 |
MeVal | N-甲基纈氨酸 |
Nva | 正纈氨酸 |
Nle | 正亮氨酸 |
Orn | 鳥氨酸 |
表5 與核苷酸序列相關的特征關鍵詞表
關鍵詞 | 說明 |
allele
| 相關的個體或菌株含有相同基因的穩定的其它形式,該形式區別 于這一位置的現有的序列(和或許其它序列) |
attenuator
|
(2)位于啟動子和第一個結構基因之間,引起轉錄的部分終止的序列區段 |
C_region
| 免疫球蛋白輕和重鏈的恒定區,和T-細胞受體α,β,和γ鏈;根據特定的鏈可 |
CAAT_signal
| CAAT盒;位于可能參與RNA聚合酶結合的真核生物轉錄單位的起始點的75bp |
CDS
| 編碼序列;對應于蛋白質中的氨基酸序列的核苷酸的序列(位置包括終止密碼子) |
累計代理量
城市布局
團隊實力
服務用戶數