情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
日本版NIH創設に向けた新しい指標の開発(4) パイプラインにつながる特許の判別指標
治部 眞里長部 喜幸
著者情報
ジャーナル フリー HTML

2014 年 57 巻 1 号 p. 29-37

詳細
著者抄録

日本版NIHや製薬企業における,政策決定・戦略立案に資するエビデンス提供のため,新しい指標に基づいた医薬品産業の現状俯瞰・将来予測を試みた。今回は,医薬品産業における基礎研究力を特許から把握するため,製薬企業の個々の研究開発テーマの進捗状況(【非臨床試験】→【フェーズ1】→【フェーズ2】→【フェーズ3】→【承認申請】→【承認】→【市販】)と密接に関連する特許を特定するための新しい指標の導出を試みた。指標としては,IPCコード数,被引用特許数,特許が引用する非特許文献数が有力であることがわかった。これにより,医薬品産業の新薬創出力および将来の新薬創出力がパイプラインだけでなく,特許においても把握可能である。

1. はじめに

「日本版NIH創設に向けた新しい指標の開発(1)~(3)」において1)3),製薬企業が有する個々のパイプラインや医薬品により,各国の現状および将来における新薬創出力を把握できることが示せたが,その前段階の基礎研究においては,どのようになっているのだろうか。拙著(2)においては,前段階の基礎研究動向を把握するため,論文数および特許出願数を用いて分析を行った。特許の数で言えば,ロケットやコンピューターのように1製品が何千,何万もの特許で構成されている分野とは違い,低分子医薬品やバイオ医薬品は少数の特許で構成されていると言われている4)。しかし,拙著(2)で導出された特許出願数は,1991年から2001年および2002年から2012年の2期間において,米国で5,899件と5,323件,日本で270件と1,045件である。それに対して「市販」数およびパイプライン数の合計では,米国が218件,日本は58件にしか満たない。拙著(1)の図6「創薬プロセス」で示したように,市販されるまでには十数年の月日が必要であり,医薬品の「基礎研究」が行われたのが,7年から14年前としても,特許出願数と「市販」数および「パイプライン」数の間の開きは大き過ぎると考えられる。これは,国によっては,特許は出願だけで審査請求がされずに終わることもあり,他に特許が取られないためにまず特許を出願するという防衛特許もあることが原因かもしれない。

ここでわれわれの分析に必要なのは,事業主体個々のパイプラインや医薬品に直接関連した特許を抽出することである。それには,実際の事業主体の個々の研究開発テーマの進捗状況につながる特許を導出するための新しい指標が必要不可欠である。その新しい指標を使用すれば,製品につながるような特許を予測でき,イノベーション創出の基礎研究力を正確に把握することが可能となる。これまで医薬品数およびパイプライン数を用いることで,各国の新薬創出力の現状把握および将来予測が可能なことを示してきたが,今回製品につながるような特許が予測できれば,さらに長期スパンの将来予測ができると考えられる。これにより日本版NIHや製薬企業における政策立案・戦略立案において,基礎研究から製品までの一貫した新薬創出力を示すことが可能となる。

なお,本稿は著者の私見であり,著者が所属する機関の意見・見解を表明するものでない点に留意願いたい。

2. 特許分析における指標

医薬品産業において,特許戦略は非常に重要であることは言うまでもなく,特許の取得,維持管理,他者へのライセンス供与等,各事業主体とも多大な投資を行って,競争力の源泉の1つとしている。特に他者へのライセンス供与の重要性については,拙著(3)で触れたとおりである。

これまで,特許戦略において問われてきたのは,特許の数より質であることから,質を評価する指標に関しては多くの研究が行われてきている。OECDでは,これまでの研究を総括し,特許の質の指標として考えられるものをまとめている。それによると,(1)特許ファミリーの構成数,(2)請求項の数,(3)IPCコード注1)数,(4)ECLAコード注2)数,(5)ICOコード注3)数,(6)前方引用数,(7)後方引用数,(8)非特許文献数,(9)請求項数等があげられている5)。しかし,質を決める指標としては定着したものがない。

さらに質の研究を難しくしているのが,導出してきた指標によって抽出された特許群が,質を反映しているか否かを検証することである。この検証過程においては,すでに特許の質がわかっていなければならない。これまで検証過程において質の高い特許として用いられたのが,専門家が選定した特許リスト等,定性的な評価結果である。後藤らは,特許庁が毎年公表している「技術動向調査」においてリスト化された「重要特許」を分析に用いている6)。この「重要特許」は,特許庁から委託された調査機関が専門家の意見を踏まえて選定するものである。

本研究において開発を目指すのは,質の高い特許を把握する指標というよりも,製薬企業が有する個々のパイプラインや医薬品と直接関連した特許が抽出可能とする指標を特定することである。つまり,その特定された指標を使うことによって,低分子医薬品およびバイオ医薬品の特許の中で,パイプラインから市販薬へと直接関連する特許を抽出することを可能とする。

そこで,糖尿病治療薬と細胞治療薬という2つの分野に限定し,製薬企業の個々の研究開発テーマの進捗状況(【非臨床試験】→【フェーズ1】→【フェーズ2】→【フェーズ3】→【承認申請】→【承認】→【市販】)と関連した特許の抽出をThomson Reuters社の当該分野の専門家に同定を依頼し,その結果と,IPCコードを使用して抽出した糖尿病治療薬と細胞治療薬という2つの分野の特許の比較分析を行った。

3. 分析

3.1 分析データ①

まず,糖尿病治療薬と細胞治療薬に関連する特許を以下のIPCコードを使用し,Thomson Reuters社の「Derwent World Patents Index(以下,DWPIとする)」から抽出した。さらに,(1)IPCコード数,(2)被引用特許数,(3)引用特許数,(4)特許が引用する非特許文献数,(5)1ファミリーを構成する特許数,を集計した。優先権主張年が1981年から2011年までのデータを対象としている。糖尿病治療薬は,28,351特許ファミリー数であり,細胞治療薬は3,464特許ファミリー数である。

なお,DWPIは,Thomson Reuters社が提供する世界最大の付加価値特許データベースであり,各技術分野の専門家により編集された独自の英文抄録と索引によって,必要な特許情報を包括的かつ効率的に検索,把握,分析することができる7)。特許庁が毎年実施している特許出願動向調査(マクロ調査)8)にも使用されている,特許情報を取得するための代表的なデータベースの1つである。

  • 【IPCコード】
  • 糖尿病:A61P 3/10
  • 細胞治療:A61K 35/12かつC12N 5/07

3.2 分析データ②

Thomson Reuters社のCortellis for Competitive Intelligenceに収録されたDiabetes Mellitus(糖尿病治療薬)とCell Therapy(細胞治療薬)における医薬品(プログラム)名,開発段階,起源会社名,アブストラクト,医薬品とリンクした特許情報等を抽出した。抽出日は,2012年3月21日,抽出期間は1994年から2012年3月21日を対象としている。抽出件数は,糖尿病治療薬が,中止・撤退を含めて1,764件。細胞治療薬が728件である。そのうち特許が抽出できたものは,糖尿病治療薬が634件,細胞治療薬が215件である。

なお,同データベースは,各社の医薬品開発を横断・統合的に俯瞰するための代表的なデータベースの1つである9)。Thomson Reuters社は複数のデータソースからの情報を審査したうえで手作業で選別し,情報を更新している。同データベースには,医薬品のパイプライン,ディール,特許,企業情報,業界情報などが含まれ,約5万件の医薬品・パイプラインについて開発状況,化学構造,作用機序,企業・国・適応症別の開発段階などが網羅されている。また,Thomson Reuters社の当該分野の専門家が,製薬企業の個々の市販薬またはパイプラインと関連する特許を同定し,市販薬またはパイプラインに用いられた特許と同定された場合は,当該特許へのリンクが表示される。

前回までの分析1)3)においては,Evaluate社のEvaluatePharmaを用いたが,今回の特許に関連する分析には,Cortellisが有する医薬品とリンクした特許情報が必要であるため,データベースを変更した。

3.3 分析

IPCコードを使用して抽出された3.1の分析データ①において,データ②の中ですでに上市された,またはパイプラインとして開発中の医薬品の特許を【1】,それ以外を【0】の二値を目的変数とし,分析データ①で示した(1)~(5)を説明変数として,二値ロジスティック回帰モデルにより解析を行った(二値ロジスティック回帰モデルについては,5章を参照されたい)。分析データ①からランダム抽出して,①および②のデータ数を同数とした。

4. 分析結果

1は,ロジスティック回帰分析の結果である。

表1 ロジスティック回帰分析の結果
係数 標準偏差 Z値 Pr(>|z|) 有意水準
切片 -0.05474 0.0824 -0.664 0.50638
IPCコード数 -0.009 0.0018 -4.89 1.01E-06 ***
被引用特許数 0.020355 0.0031 6.645 3.03E-11 ***
引用特許数 0.003728 0.0025 1.516 0.12958
特許が引用する非特許文献数 0.003718 0.0014 2.626 0.00864 **
1ファミリーを構成する特許数 -0.00062 0.0041 -0.153 0.87859

(注)**:有意水準0.01(1%),***:有意水準 0.001(0.1%)

IPCコード数,被引用特許数,引用特許数,特許が引用する非特許文献数,1ファミリーを構成する特許数のうち,個々の研究開発テーマの進捗状況に関連した特許に相関が高いのは,IPCコード数,被引用特許数,特許が引用する非特許文献数,ということがわかる。被引用特許数,特許が引用する非特許文献数が多いほど,またIPCコード数が少ないほど,進捗状況に関連した特許と言える。上記指標は0.1%有意,1%有意と有意水準が高く,個々の研究開発テーマの進捗状況に関連した特許の指標となる可能性が非常に高いと解釈できる。

4.1 IPCコード数

IPCの数が多いということは,技術的な幅の広さを象徴しているといわれている。そしてIPCコードが多く付与されている特許ほど,無効審判等により事後に無効とされる確率も高くなるといわれている10)

4.2 特許が引用する非特許文献数

特許が引用する非特許としては,査読付き論文,会議録,DNA構造,遺伝子,化合物等のデータベース,関連論文等である。非特許文献は,科学が技術に与えた貢献度を示し,科学知識と発明がいかに近いか,つまり科学の発展と技術の発展の距離を表している11)。また,特許に引用されている非特許文献は,より複雑で根源的な知識が含まれているとも考えられている12)。さらに非特許文献を引用している特許は,していない特許よりも質が高いという報告もある13)

OECD Science,Technology and Industry Scoreboard 2013においても,WIPO(World Intellectual Property Organization,世界知的所有権機関)の技術分野別に,非特許文献のうち査読付き論文がどのような分野から引用されているか,またどの技術分野が高いかが示されている。それによると製薬分野とバイオテクノロジー分野の特許に査読付き論文が多いことがわかっている14)

4.3 引用特許数・被引用特許数

特許には,前方引用(Forward Citation)と後方引用(Backward Citation)がある。

1の特許Aが他の特許B,特許C,文献Dを引用していることを後方引用(Backward Citation)と呼び,特許Aが特許E,特許F,特許Gから引用されていることを前方引用(Forward Citation)と呼んでいる。特許Aが特許E,特許F,特許Gから引用されている回数が被引用特許数である。被引用回数が多いということは,その発明に続く技術の発展にいかに寄与したかを示し,その発明の経済的価値をも反映しているといわれている15)

図1 前方引用と後方引用との関係

一方,後方引用(Backward Citation)は,特許Aが引用する特許B,特許C,文献Dで,審査官および出願人により引用される。特許審査官は,その発明に新規性および進歩性等があるかどうかを判断する。仮にその出願を拒絶する場合は,その根拠を明示するために,文献を引用する。また,その出願を拒絶しない場合においても,審査官が判断の客観性・透明性の担保や第三者による特許査定後の情報提供等に資するために必要と判断した場合には,特許メモが作成され,参考文献によりその根拠が示されることがある16)。結果として,後方引用は,特許Aの発明の基礎となった知識のソースとして参照される。

4.4 1ファミリ―を構成する特許数

2012年にノーベル生理学・医学賞を受賞した京都大学の山中伸弥教授の特許で特許ファミリー構成数について見てみよう。山中教授のiPS細胞関連特許は,2005年に日本特許庁に特許出願され,その出願を優先権主張の基礎とし,翌年国際出願し,米国,欧州等へと移行されている。その後,2008年に日本に国内移行された。特願2007-550210号がその特許である。さらにこの特許は7個に分割出願もされている(2)。

図2 京都大学のiPS細胞関連特許(日本への特許出願)

特願2007-550210号の請求項のうち,4遺伝子を体細胞に導入するiPS細胞の製造方法を「特願2008-131577号」,3種の遺伝子が導入された体細胞を特定のタンパク質の存在下で培養する工程を含むiPS細胞の製造方法を「特願2009-056747号」,特定タンパク質の存在下で体細胞からiPS細胞を製造するための3種の遺伝子の使用を「特願2009-056748号」,4種の遺伝子を体細胞に導入してiPS細胞を得る工程とiPS細胞を分化導入する工程を含む体細胞の製造方法を「特願2009-056750号」に分割して,特許出願している。これら4つおよび特願2007-550210号について,特許権の設定登録がなされた。

米国に出願された特許も米国出願12/086,479をはじめとして7つに分割出願(一部継続出願)された(3)。さらに欧州特許庁に出願された特許は,EP06834636.0をはじめとして4つに分割出願されている。その他オーストラリア,カナダ,中国,イスラエル,韓国,メキシコ,南アフリカ,ニュージーランド等,複数の国へと出願されている。このように同じ発明を複数の国へ出願したもの,およびそれを分割して出願したものをまとめて「特許ファミリー」と呼んでいる。そしてその数を特許ファミリー構成数としている。

図3 京都大学のiPS細胞関連特許(米国および欧州への特許出願)

本研究で使用したDWPIの最大の特徴は「各国に出願された同じ発明に関する公報を一つのパテントファミリーとして集約し、発明単位で一つのレコードを作成」していることである17)。パテントファミリーは,優先権情報を使用することによって集約するのが一般的だが,DWPIは,パリ条約の優先権をもたずファミリー関係が明白でないものについても,DWPIの専門家集団が調査を加えて,パテントファミリーのメンバーとして収録するなど,発明の内容情報から,1発明に関する技術情報を1発明,つまり1ファミリーとしている。これにより,1発明→1特許→パイプライン→市販を連結させることが可能となる。

5. 特許分析における指標

次に,4章での分析結果をもとに,特許分析における指標の構築を試みた。(1)IPCコード数,(2)被引用特許数,(3)引用特許数,(4)特許が引用する非特許文献数,(5)1ファミリーを構成する特許数,を説明変数として,二値ロジスティック回帰モデルより解析を行った。

二値ロジスティック回帰モデルとは,たとえば,ある商品の購入の有無(購入した/購入しなかった)のように,2つの値しか取りえない値(これを従属変数という)について,顧客が有する年齢・性別・年収などの値(これを説明変数という)を用いて,その発生確率を予測するものである。今回の分析では,特許が医薬品に「繋がった」「繋がらなかった」という2つの値しか取りえない事象の発生確率を予測するので,このモデルを使用した。二値ロジスティック回帰モデルは以下の式1で表される。

式1

これは,製薬機関が有する個々のパイプラインや医薬品に繋がった特許の従属変数pが1,繋がらなかった特許のpを0として,その発生確率を求めるものである。iは個々の特許を示し,χ1,χ2,… χκはそれぞれの説明変数の値を示し,α,β1,… βκ1の係数を示す。4章での分析結果を式1に当てはめ両辺の対数をとることで,式2が導出できる。

式2(式中χ1~χ5は,それぞれ上記(1)~(5)を示す)

式2から導出された値(すなわち式2のMの値)を横軸におき,式1を用いて計算した発生確率piの値を縦軸にプロットしたものが4および5である。4は,製薬企業が有する個々のパイプラインや医薬品に繋がった特許のプロット,5は繋がらなかった特許のプロットである。それぞれの図の縦軸の値(すなわち式1のpiの値)が1に近づくと医薬品に繋がった特許であることを意味し,0に近づくと繋がらなかった特許であることを意味する。

図4 分析結果(パイプラインや医薬品に繋がった特許)
図5 分析結果(パイプラインや医薬品に繋がらなかった特許)

45を比較すると,パイプラインや医薬品に繋がった特許(4)はMの値が0付近より大きく,繋がらなかった特許(5)はMの値が0付近より小さい傾向にある。したがって,たとえばM=0を閾値として,パイプラインや医薬品に繋がる特許とそうでない特許を大まかに選別できる。言い換えると,IPCコード数,被引用特許数,引用特許数,特許が引用する非特許文献数,1ファミリーを構成する特許数などの説明変数の値を式1および式2に代入し,個々の特許を45のようにプロットし,M=0を境に分けることで,パイプラインや医薬品に繋がる特許とそうでない特許を大まかに選別できるシステムを構築した。

これにより,従来の指標であった特許出願数に代わる,いわば「パイプラインや医薬品に繋がる特許出願数」の提示が可能になったといえる。

6. おわりに

本研究は,医薬品まで繋がった特許を判別する方法を検討することを目的としており,そのために製薬企業の個々の研究開発テーマの進捗状況(【非臨床試験】→【フェーズ1】→【フェーズ2】→【フェーズ3】→【承認申請】→【承認】→【市販】)と関連した特許を専門家に依頼して抽出,特許の質に関係するOECDが提唱するさまざまな指標を用い,その相関の分析を試みた。分析の結果,以下の指標が,医薬品まで繋がった特許を判別するための指標として有効であることが明らかとなった。

(1)付与されているIPCコード数が少ないこと

(2)被引用特許数が多いこと

(3)特許が引用する非特許文献数が多いこと

これらの指標を使用することで,基礎研究における新薬創出力を知ることができれば,医薬品産業の将来予測を可能にする特許の新しい指標となり,それにより医薬品産業の将来図を俯瞰できる。また,日本版NIHや製薬企業における政策決定・戦略立案に資するエビデンス,つまり基礎研究から市販薬までが連結されたデータの提供を行うことも可能である。

これまで特許出願数や特許登録数が用いられることが多かったが,われわれが提示する新しい特許指標を用いることで,医薬品産業におけるイノベーション創出力に対する適切な研究評価をすることも可能と考えられる。

次回は,5章で述べた特許分析における指標に基づき,医薬品開発の基礎研究の現状と将来予測について報告する。

謝辞

なお,本研究の一部は独立行政法人科学技術振興機構(JST)戦略的創造研究推進事業(社会技術研究開発)「科学技術イノベーション政策のための科学」(プログラム総括:森田朗・学習院大学法学部教授)における研究課題「未来産業創造にむかうイノベーション戦略の研究」(山口栄一・同志社大学大学院総合政策科学研究科教授,研究期間:平成23~26年度)の支援を受けて行われたものである。

本文の注
注1)  International Patent Classification:国際特許分類

注2)  European Classification:国際特許分類を細展開したEPOの内部分類。日本国特許庁のFIに相当するもので,国際特許分類にアルファベット大文字と数字が付加されている(特許庁Webサイト「用語解説」より)。

注3)  In Computer Only:欧州特許庁では,特許の分類体系として,ECLAと併せてICO(In Computer Only)も用いられている。ECLAは特許文献の特徴を示すのに対し,ICOは補足的な特徴を示し,異なる技術的特徴の組み合わせ等に対して付与される18)。http://dx.doi.org/10.1241/johokanri.53.241

参考文献
 
© 2014 Japan Science and Technology Agency
feedback
Top