数学において凸共役(とつきょうやく、英: convex conjugation)とは、ルジャンドル変換の一般化である。ルジャンドル=フェンシェル変換あるいはフェンシェル変換としても知られる(アドリアン=マリ・ルジャンドルとウェルナー・フェンシェル(英語版)の名にちなむ)。
定義
を実ノルム線型空間とし、
を
の双対空間とする。双対組を次で表す。
![{\displaystyle \langle \cdot ,\cdot \rangle :X^{*}\times X\to \mathbb {R} .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/97d4ab50accadcfa1b5bd81d8c421d860e46de2b)
拡大実数に値を取る函数
![{\displaystyle f:X\to \mathbb {R} \cup \{+\infty \}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c7c8b68af5683579d2f77e69a293bbb3d501dfea)
に対する凸共役
![{\displaystyle f^{\star }:X^{*}\to \mathbb {R} \cup \{+\infty \}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0a3b112e10928eed4023471bb20bdc0d876ccdd3)
は、上限を用いて次のように定義される。
![{\displaystyle f^{\star }\left(x^{*}\right):=\sup \left\{\langle x^{*},x\rangle -f(x)\mid x\in X\right\}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/71c1468cb7d5f4b057e734caf4d2d9883422f9a4)
あるいは、同値であるが、下限を用いて次のように定義される。
![{\displaystyle f^{\star }\left(x^{*}\right):=-\inf \left\{f(x)-\langle x^{*},x\rangle \mid x\in X\right\}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a9e67727e54e4b7255b66a76f95fe4f2c4b042b8)
この定義は、函数のエピグラフの凸包の、支持超平面(英語版)に関する符合化と解釈することが出来る[1] [2]。
例
アフィン函数
![{\displaystyle f(x)=\left\langle a,x\right\rangle -b,\,a\in \mathbb {R} ^{n},b\in \mathbb {R} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/3d1c71c3368aa876a8c746d45ac1ba5dca053117)
の凸共役は
![{\displaystyle f^{\star }\left(x^{*}\right)={\begin{cases}b,&x^{*}=a\\+\infty ,&x^{*}\neq a.\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d2ac6d7654f9ea49bca461f67a4626d18976c612)
である。冪函数
![{\displaystyle f(x)={\frac {1}{p}}|x|^{p},\,1<p<\infty }](https://wikimedia.org/api/rest_v1/media/math/render/svg/5114a7244077d2d304d4fc3c545e8342b4001914)
の凸共役は
![{\displaystyle f^{\star }\left(x^{*}\right)={\frac {1}{q}}|x^{*}|^{q},\,1<q<\infty }](https://wikimedia.org/api/rest_v1/media/math/render/svg/320916a4063b7b039b9456f7142aca7002965138)
である。ここで
である。
絶対値函数
![{\displaystyle f(x)=\left|x\right|}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ff92ad660d6cc68812b4ed4dc1f45d2ffeda3101)
の凸共役は
![{\displaystyle f^{\star }\left(x^{*}\right)={\begin{cases}0,&\left|x^{*}\right|\leq 1\\\infty ,&\left|x^{*}\right|>1\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f2689becd7b5888a5a815de894d915d11329dcac)
である。指数函数
の凸共役は
![{\displaystyle f^{\star }\left(x^{*}\right)={\begin{cases}x^{*}\ln x^{*}-x^{*},&x^{*}>0\\0,&x^{*}=0\\\infty ,&x^{*}<0\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6bd9dcd8638f43a9a2667f4e3fecb3ff0fa5a859)
である。指数函数の凸共役とルジャンドル変換は、凸共役の定義域が厳密に大きいことを除いて一致する。ルジャンドル変換は正の実数に対してのみ定義されるためである。
期待ショートフォール(リスク平均値)との関係
F を確率変数 X の累積分布函数とする。このとき、部分積分により
![{\displaystyle f(x):=\int _{-\infty }^{x}F(u)\,du=\operatorname {E} \left[\max(0,x-X)\right]=x-\operatorname {E} \left[\min(x,X)\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5305f9e0bbb2f5dd0fd854f406e0bf4c11e3526c)
は次の凸共役を持つ。
![{\displaystyle f^{\star }(p)=\int _{0}^{p}F^{-1}(q)\,dq=(p-1)F^{-1}(p)+\operatorname {E} \left[\min(F^{-1}(p),X)\right]=pF^{-1}(p)-\operatorname {E} \left[\max(0,F^{-1}(p)-X)\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/711a66d74ef8ef0fa4974ecb6129a50076503aae)
順序
特別な解釈により次の変換が考えられる。
![{\displaystyle f^{\text{inc}}(x):=\arg \sup _{t}\,t\cdot x-\int _{0}^{1}\max\{t-f(u),0\}\,\mathrm {d} u,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/971580947f3c8538aa24a103f581146a314ae6a0)
これは初期函数 f の非減少な書き換えである。特に、f に対する
は非減少である。
性質
閉凸函数の凸共役は再び閉凸函数である。多面体的凸函数(多面体的エピグラフを持つ凸函数)の凸共役は、再び多面体的凸函数である。
順序の反転
凸共役は、順序を反転させる。すなわち、
ならば
である。ここで
![{\displaystyle (f\leq g):\iff (\forall x,f(x)\leq g(x))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0a969d64e76793e3f11b777d19e82e3833a042bb)
である。函数の族
に対し、上限は交換されうるという事実により、次が従う。
![{\displaystyle \left(\inf _{\alpha }f_{\alpha }\right)^{*}(x)=\sup _{\alpha }f_{\alpha }^{*}(x).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c2cc43eb84e10586717fcf2286413b9544ddc323)
さらに最大最小不等式により、次が従う。
![{\displaystyle \left(\sup _{\alpha }f_{\alpha }\right)^{*}(x)\leq \inf _{\alpha }f_{\alpha }^{*}(x).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/61c67e8350bfd2e4c3c8829e6484a1a2516a5243)
二重共役
函数の凸共役は常に下半連続である。二重共役
(凸共役の凸共役)は閉凸包、すなわち、
を満たす最大の下半連続凸函数でもある。真凸函数 f に対し、次が成り立つ。
であるための必要十分条件は、f が凸かつ下半連続であることである(フェンシェル=モローの定理)
フェンシェルの不等式
任意の函数 f とその凸共役 f * に対し、次のフェンシェルの不等式(フェンシェル=ヤングの不等式としても知られる)は、すべての x ∈ X と p ∈ X * に対して成立する:
![{\displaystyle \left\langle p,x\right\rangle \leq f(x)+f^{*}(p).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/99b94634868cf8eefd666df148b440f5adc5f868)
凸性
二つの函数
と
および数
に対し、次の凸関係が成立する。
![{\displaystyle \left((1-\lambda )f_{0}+\lambda f_{1}\right)^{\star }\leq (1-\lambda )f_{0}^{\star }+\lambda f_{1}^{\star }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ee473161d8861cdc991b6d15b38dcf76e4913779)
この演算
はそれ自身が凸写像である。
極小畳み込み
二つの函数 f と g の極小畳み込み(infimal convolution)は、次で定義される(epi-sum とも呼ばれる):
![{\displaystyle \left(f\Box g\right)(x)=\inf \left\{f(x-y)+g(y)\mid y\in \mathbb {R} ^{n}\right\}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2512df4cca7e150e427e50eb2d830297f829ee5c)
f1, …, fm は Rn 上の真凸かつ下半連続な函数とする。このとき、これらの極小畳み込みは凸かつ下半連続である(が、必ずしも真凸ではない)[3]。さらに次が成立する。
![{\displaystyle \left(f_{1}\Box \cdots \Box f_{m}\right)^{\star }=f_{1}^{\star }+\cdots +f_{m}^{\star }.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b047bc9d582396201c2a80ef6cf0746b48ad4220)
二つの函数の極小畳み込みは、次のような幾何学的解釈がある:二つの函数の極小畳み込みの(厳密な)エピグラフは、それらの函数の(厳密な)エピグラフのミンコフスキー和(英語版)である[4]。
最大化引数
函数
が微分可能であるなら、その導函数は凸共役の計算における最大化引数(maximizing argument)である。すなわち、
と ![{\displaystyle f^{\star \prime }(x^{\star })=x(x^{\star }):=\arg \sup _{x}{\langle x,x^{\star }\rangle }-f(x);}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9dd84475fc5e75be48fd4ce15c9c0e74c13e781d)
が成り立つ。したがって
![{\displaystyle x=\nabla f^{\star }(\nabla f(x)),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bdaa7250d4b02574e56dad46af1be34dc52bd9c0)
![{\displaystyle x^{\star }=\nabla f(\nabla f^{\star }(x^{\star })),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2453768aa28b429c5c0518428b713ae0cb39cc18)
であり、さらに次が成立する。
![{\displaystyle f^{\prime \prime }(x)\cdot f^{\star \prime \prime }(x^{\star }(x))=1,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3faedfdb144011b18213703a041da759bb2a46c6)
![{\displaystyle f^{\star \prime \prime }(x^{\star })\cdot f^{\prime \prime }(x(x^{\star }))=1.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7d9c5da5fad1fc6aa6b49ef984b063fc39d640a1)
スケーリング性
ある
に対し、
であるなら、次が成り立つ。
![{\displaystyle g^{\star }(x^{\star })=-\alpha -\delta {\frac {x^{\star }-\beta }{\lambda }}+\gamma \cdot f^{\star }\left({\frac {x^{\star }-\beta }{\lambda \gamma }}\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9e29a768965041c83bb46f32458bb200e684e97f)
さらにパラメータ α が追加される場合は、次が成り立つ。
![{\displaystyle f_{\alpha }(x)=-f_{\alpha }({\tilde {x}}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fa4ef16a1ba1499a0730a0d0d42f95646bffa59d)
ここで
は最大化引数であるように選ばれる。
線型変換の下での挙動
A を X から Y への有界線型作用素とする。X 上の任意の凸函数 f に対して、次が成り立つ。
![{\displaystyle \left(Af\right)^{\star }=f^{\star }A^{\star }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8777674a05527d91a571f3109c59123fa31ffb81)
ここで
![{\displaystyle (Af)(y)=\inf\{f(x):x\in X,Ax=y\}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e8f397b4dc4176938ffd73af349a0832a4c1da19)
は f の A に関する原像であり、A* は A の共役作用素である[5]。
閉凸函数 f は、ある与えられた直交線型変換の集合 G に関して対称である、すなわち
![{\displaystyle f\left(Ax\right)=f(x),\;\forall x,\;\forall A\in G}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7e8d94a3fb5b747c20c42f0ea59107d30d9f490a)
であるための必要十分条件は、凸共役 f* が G に関して対称であることである。
代表的な凸共役の表
次の表では、多くの有名な函数のルジャンドル変換で、有用な性質を持つものが示されている[6]。
![{\displaystyle g(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c6ca91363022bd5e4dcb17e5ef29f78b8ef00b59) | ![{\displaystyle \operatorname {dom} (g)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9eeed1e263e03f687899f36d513096bbf3d2e0ae) | ![{\displaystyle g^{*}(x^{*})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a0e4a070f0e99ae6129ff47cedef4c6ae1e7bdc3) | |
(where ) | ![{\displaystyle X}](https://wikimedia.org/api/rest_v1/media/math/render/svg/68baa052181f707c662844a465bfeeb135e82bab) | ![{\displaystyle f^{*}\left({\frac {x^{*}}{a}}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e7014b51a4f83745028c8296adc7b9a8fa71fea8) | |
![{\displaystyle f(x+b)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ca3a08649ffc5e56832f62e8ff65b1733895036e) | ![{\displaystyle X}](https://wikimedia.org/api/rest_v1/media/math/render/svg/68baa052181f707c662844a465bfeeb135e82bab) | ![{\displaystyle f^{*}(x^{*})-\langle b,x^{*}\rangle }](https://wikimedia.org/api/rest_v1/media/math/render/svg/6faf439330094920c88809ac1b7331053f0c4e98) | |
(where ) | ![{\displaystyle X}](https://wikimedia.org/api/rest_v1/media/math/render/svg/68baa052181f707c662844a465bfeeb135e82bab) | ![{\displaystyle af^{*}\left({\frac {x^{*}}{a}}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e9072bb847feba78bcde26b659e35af0e3f4ce8) | |
![{\displaystyle \alpha +\beta x+\gamma \cdot f(\lambda x+\delta )}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e857392f088c90d05f07d014526af5fc85f1674) | ![{\displaystyle X}](https://wikimedia.org/api/rest_v1/media/math/render/svg/68baa052181f707c662844a465bfeeb135e82bab) | ![{\displaystyle -\alpha -\delta {\frac {x^{*}-\beta }{\lambda }}+\gamma \cdot f^{*}\left({\frac {x^{*}-\beta }{\gamma \lambda }}\right)\quad (\gamma >0)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8d9b5a07b040508e4674fa5318a335079aee4816) | |
(where ) | ![{\displaystyle \mathbb {R} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/786849c765da7a84dbc3cce43e96aad58a5868dc) | (where ) | |
(where ) | ![{\displaystyle \mathbb {R} _{+}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7c1f2c2437bae14145e43c54cb7e1ee2701b2106) | (where ) | |
![{\displaystyle {\sqrt {1+x^{2}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/728fa9a3b2dfecff9948c11fa88df510e7014c97) | ![{\displaystyle \mathbb {R} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/786849c765da7a84dbc3cce43e96aad58a5868dc) | ![{\displaystyle -{\sqrt {1-(x^{*})^{2}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/819d30e0bdfea9a5a198b4b481b28ecae79a596e) | |
![{\displaystyle -\log(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/38fab9fc3e6d567d75ffb42c0aa098751f93c8f2) | ![{\displaystyle \mathbb {R} _{++}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/472e706f7f60887778abab594e23c5c0949d66f2) | ![{\displaystyle -(1+\log(-x^{*}))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/90c4f294425834e85cc8e4c651eaec7c00908ba4) | |
![{\displaystyle e^{x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/841c0d168e64191c45a45e54c7e447defd17ec6a) | ![{\displaystyle \mathbb {R} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/786849c765da7a84dbc3cce43e96aad58a5868dc) | ![{\displaystyle {\begin{cases}x^{*}\log(x^{*})-x^{*}&{\text{if }}x^{*}>0\\0&{\text{if }}x^{*}=0\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e97f2447714bf8a8bd110ceeedd41d4b18b83cb5) | |
![{\displaystyle \log \left(1+e^{x}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a9e3356733af8e492ff6ede9f4112d45a7054744) | ![{\displaystyle \mathbb {R} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/786849c765da7a84dbc3cce43e96aad58a5868dc) | ![{\displaystyle {\begin{cases}x^{*}\log(x^{*})+(1-x^{*})\log(1-x^{*})&{\text{if }}0<x^{*}<1\\0&{\text{if }}x^{*}=0,1\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7cd0683bc57dfa1f5bf69ca651aa5fbd75b1c06b) | |
![{\displaystyle -\log \left(1-e^{x}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/967679eb7190a576210fd740fc8ab099b97de71c) | ![{\displaystyle \mathbb {R} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/786849c765da7a84dbc3cce43e96aad58a5868dc) | ![{\displaystyle {\begin{cases}x^{*}\log(x^{*})-(1+x^{*})\log(1+x^{*})&{\text{if }}x^{*}>0\\0&{\text{if }}x^{*}=0\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9bed1b24180fcc2191333ba6e8c73779b30c1a8c) | |
関連項目
参考文献
- ^ “Legendre Transform”. 2012年9月13日閲覧。
- ^ “Legendre transformation and information geometry”. 2015年7月13日閲覧。
- ^ Phelps, Robert (1991). Convex Functions, Monotone Operators and Differentiability (2 ed.). Springer. p. 42. ISBN 0-387-56715-1
- ^ Bauschke, Heinz H.; Goebel, Rafal; Lucet, Yves; Wang, Xianfu (2008). “The Proximal Average: Basic Theory”. SIAM Journal on Optimization 19 (2): 766. doi:10.1137/070687542.
- ^ Ioffe, A.D. and Tichomirov, V.M. (1979), Theorie der Extremalaufgaben. Deutscher Verlag der Wissenschaften. Satz 3.4.3
- ^ Borwein, Jonathan; Lewis, Adrian (2006). Convex Analysis and Nonlinear Optimization: Theory and Examples (2 ed.). Springer. pp. 50–51. ISBN 978-0-387-29570-1
- Arnol'd, Vladimir Igorevich (1989). Mathematical Methods of Classical Mechanics (Second ed.). Springer. ISBN 0-387-96890-3. MR997295
- Rockafellar, R. Tyrell (1970). Convex Analysis. Princeton: Princeton University Press. ISBN 0-691-01586-4. MR0274683
外部リンク
- Touchette, Hugo (2005年7月27日). “Legendre-Fenchel transforms in a nutshell” (PDF). 2009年3月6日時点のオリジナルよりアーカイブ。2007年7月24日閲覧。
- Touchette, Hugo (2006年11月21日). “Elements of convex analysis” (PDF). 2008年3月26日閲覧。
- “Legendre and Legendre-Fenchel transforms in a step-by-step explanation”. 2013年5月18日閲覧。