凸共役性

数学において凸共役（とつきょうやく、英: convex conjugation）とは、ルジャンドル変換の一般化である。ルジャンドル＝フェンシェル変換あるいはフェンシェル変換としても知られる（アドリアン＝マリ・ルジャンドルとウェルナー・フェンシェル（英語版）の名にちなむ）。

定義

$X$ を実ノルム線型空間とし、 $X^{*}$ を $X$ の双対空間とする。双対組を次で表す。

\langle \cdot ,\cdot \rangle :X^{*}\times X\to \mathbb {R} .

拡大実数に値を取る函数

f:X\to \mathbb {R} \cup \{+\infty \}

に対する凸共役

f^{\star }:X^{*}\to \mathbb {R} \cup \{+\infty \}

は、上限を用いて次のように定義される。

f^{\star }\left(x^{*}\right):=\sup \left\{\langle x^{*},x\rangle -f(x)\mid x\in X\right\}.

あるいは、同値であるが、下限を用いて次のように定義される。

f^{\star }\left(x^{*}\right):=-\inf \left\{f(x)-\langle x^{*},x\rangle \mid x\in X\right\}.

この定義は、函数のエピグラフの凸包の、支持超平面（英語版）に関する符合化と解釈することが出来る^[1] ^[2]。

例

アフィン函数

f(x)=\left\langle a,x\right\rangle -b,\,a\in \mathbb {R} ^{n},b\in \mathbb {R}

の凸共役は

f^{\star }\left(x^{*}\right)={\begin{cases}b,&x^{*}=a\\+\infty ,&x^{*}\neq a.\end{cases}}

である。冪函数

f(x)={\frac {1}{p}}|x|^{p},\,1<p<\infty

の凸共役は

f^{\star }\left(x^{*}\right)={\frac {1}{q}}|x^{*}|^{q},\,1<q<\infty

である。ここで ${\tfrac {1}{p}}+{\tfrac {1}{q}}=1$ である。

絶対値函数

f(x)=\left|x\right|

の凸共役は

f^{\star }\left(x^{*}\right)={\begin{cases}0,&\left|x^{*}\right|\leq 1\\\infty ,&\left|x^{*}\right|>1\end{cases}}

である。指数函数 $f(x)=\,\!e^{x}$ の凸共役は

f^{\star }\left(x^{*}\right)={\begin{cases}x^{*}\ln x^{*}-x^{*},&x^{*}>0\\0,&x^{*}=0\\\infty ,&x^{*}<0\end{cases}}

である。指数函数の凸共役とルジャンドル変換は、凸共役の定義域が厳密に大きいことを除いて一致する。ルジャンドル変換は正の実数に対してのみ定義されるためである。

期待ショートフォール（リスク平均値）との関係

F を確率変数 X の累積分布函数とする。このとき、部分積分により

f(x):=\int _{-\infty }^{x}F(u)\,du=\operatorname {E} \left[\max(0,x-X)\right]=x-\operatorname {E} \left[\min(x,X)\right]

は次の凸共役を持つ。

f^{\star }(p)=\int _{0}^{p}F^{-1}(q)\,dq=(p-1)F^{-1}(p)+\operatorname {E} \left[\min(F^{-1}(p),X)\right]=pF^{-1}(p)-\operatorname {E} \left[\max(0,F^{-1}(p)-X)\right].

順序

特別な解釈により次の変換が考えられる。

f^{\text{inc}}(x):=\arg \sup _{t}\,t\cdot x-\int _{0}^{1}\max\{t-f(u),0\}\,\mathrm {d} u,

これは初期函数 f の非減少な書き換えである。特に、f に対する $f^{\text{inc}}=f$ は非減少である。

性質

閉凸函数の凸共役は再び閉凸函数である。多面体的凸函数（多面体的エピグラフを持つ凸函数）の凸共役は、再び多面体的凸函数である。

順序の反転

凸共役は、順序を反転させる。すなわち、 $f\leq g$ ならば $f^{*}\geq g^{*}$ である。ここで

(f\leq g):\iff (\forall x,f(x)\leq g(x))

である。函数の族 $\left(f_{\alpha }\right)_{\alpha }$ に対し、上限は交換されうるという事実により、次が従う。

\left(\inf _{\alpha }f_{\alpha }\right)^{*}(x)=\sup _{\alpha }f_{\alpha }^{*}(x).

さらに最大最小不等式により、次が従う。

\left(\sup _{\alpha }f_{\alpha }\right)^{*}(x)\leq \inf _{\alpha }f_{\alpha }^{*}(x).

二重共役

函数の凸共役は常に下半連続である。二重共役 $f^{**}$ （凸共役の凸共役）は閉凸包、すなわち、 $f^{**}\leq f$ を満たす最大の下半連続凸函数でもある。真凸函数 f に対し、次が成り立つ。

f=f^{**}

であるための必要十分条件は、f が凸かつ下半連続であることである（フェンシェル＝モローの定理）

フェンシェルの不等式

任意の函数 f とその凸共役 f * に対し、次のフェンシェルの不等式（フェンシェル＝ヤングの不等式としても知られる）は、すべての x ∈ X と p ∈ X * に対して成立する：

\left\langle p,x\right\rangle \leq f(x)+f^{*}(p).

凸性

二つの函数 $f_{0}$ と $f_{1}$ および数 $0\leq \lambda \leq 1$ に対し、次の凸関係が成立する。

\left((1-\lambda )f_{0}+\lambda f_{1}\right)^{\star }\leq (1-\lambda )f_{0}^{\star }+\lambda f_{1}^{\star }

この演算 $\star$ はそれ自身が凸写像である。

極小畳み込み

二つの函数 f と g の極小畳み込み（infimal convolution）は、次で定義される（epi-sum とも呼ばれる）：

\left(f\Box g\right)(x)=\inf \left\{f(x-y)+g(y)\mid y\in \mathbb {R} ^{n}\right\}.

f₁, …, f_m は Rⁿ 上の真凸かつ下半連続な函数とする。このとき、これらの極小畳み込みは凸かつ下半連続である（が、必ずしも真凸ではない）^[3]。さらに次が成立する。

\left(f_{1}\Box \cdots \Box f_{m}\right)^{\star }=f_{1}^{\star }+\cdots +f_{m}^{\star }.

二つの函数の極小畳み込みは、次のような幾何学的解釈がある：二つの函数の極小畳み込みの（厳密な）エピグラフは、それらの函数の（厳密な）エピグラフのミンコフスキー和（英語版）である^[4]。

最大化引数

函数 $f$ が微分可能であるなら、その導函数は凸共役の計算における最大化引数（maximizing argument）である。すなわち、

f^{\prime }(x)=x^{*}(x):=\arg \sup _{x^{\star }}{\langle x,x^{\star }\rangle }-f^{\star }(x^{\star })

と

f^{\star \prime }(x^{\star })=x(x^{\star }):=\arg \sup _{x}{\langle x,x^{\star }\rangle }-f(x);

が成り立つ。したがって

x=\nabla f^{\star }(\nabla f(x)),

x^{\star }=\nabla f(\nabla f^{\star }(x^{\star })),

であり、さらに次が成立する。

f^{\prime \prime }(x)\cdot f^{\star \prime \prime }(x^{\star }(x))=1,

f^{\star \prime \prime }(x^{\star })\cdot f^{\prime \prime }(x(x^{\star }))=1.

スケーリング性

ある $\gamma >0$ に対し、 $\,g(x)=\alpha +\beta x+\gamma \cdot f(\lambda x+\delta )$ であるなら、次が成り立つ。

g^{\star }(x^{\star })=-\alpha -\delta {\frac {x^{\star }-\beta }{\lambda }}+\gamma \cdot f^{\star }\left({\frac {x^{\star }-\beta }{\lambda \gamma }}\right).

さらにパラメータ α が追加される場合は、次が成り立つ。

f_{\alpha }(x)=-f_{\alpha }({\tilde {x}}).

ここで ${\tilde {x}}$ は最大化引数であるように選ばれる。

線型変換の下での挙動

A を X から Y への有界線型作用素とする。X 上の任意の凸函数 f に対して、次が成り立つ。

\left(Af\right)^{\star }=f^{\star }A^{\star }

ここで

(Af)(y)=\inf\{f(x):x\in X,Ax=y\}

は f の A に関する原像であり、A^* は A の共役作用素である^[5]。

閉凸函数 f は、ある与えられた直交線型変換の集合 G に関して対称である、すなわち

f\left(Ax\right)=f(x),\;\forall x,\;\forall A\in G

であるための必要十分条件は、凸共役 f^* が G に関して対称であることである。

代表的な凸共役の表

次の表では、多くの有名な函数のルジャンドル変換で、有用な性質を持つものが示されている^[6]。

$g(x)$	$\operatorname {dom} (g)$	$g^{}(x^{})$	$\operatorname {dom} (g^{*})$
$f(ax)$ (where $a\neq 0$ )	$X$	$f^{}\left({\frac {x^{}}{a}}\right)$	$X^{*}$
$f(x+b)$	$X$	$f^{}(x^{})-\langle b,x^{*}\rangle$	$X^{*}$
$af(x)$ (where $a>0$ )	$X$	$af^{}\left({\frac {x^{}}{a}}\right)$	$X^{*}$
$\alpha +\beta x+\gamma \cdot f(\lambda x+\delta )$	$X$	$-\alpha -\delta {\frac {x^{}-\beta }{\lambda }}+\gamma \cdot f^{}\left({\frac {x^{*}-\beta }{\gamma \lambda }}\right)\quad (\gamma >0)$	$X^{*}$
${\frac {\|x\|^{p}}{p}}$ (where $p>1$ )	$\mathbb {R}$	${\frac {\|x^{*}\|^{q}}{q}}$ (where ${\frac {1}{p}}+{\frac {1}{q}}=1$ )	$\mathbb {R}$
${\frac {-x^{p}}{p}}$ (where $0<p<1$ )	$\mathbb {R} _{+}$	${\frac {-(-x^{*})^{q}}{q}}$ (where ${\frac {1}{p}}+{\frac {1}{q}}=1$ )	$\mathbb {R} _{--}$
${\sqrt {1+x^{2}}}$	$\mathbb {R}$	$-{\sqrt {1-(x^{*})^{2}}}$	$[-1,1]$
$-\log(x)$	$\mathbb {R} _{++}$	$-(1+\log(-x^{*}))$	$\mathbb {R} _{--}$
$e^{x}$	$\mathbb {R}$	${\begin{cases}x^{}\log(x^{})-x^{}&{\text{if }}x^{}>0\\0&{\text{if }}x^{*}=0\end{cases}}$	$\mathbb {R} _{+}$
$\log \left(1+e^{x}\right)$	$\mathbb {R}$	${\begin{cases}x^{}\log(x^{})+(1-x^{})\log(1-x^{})&{\text{if }}0<x^{}<1\\0&{\text{if }}x^{}=0,1\end{cases}}$	$[0,1]$
$-\log \left(1-e^{x}\right)$	$\mathbb {R}$	${\begin{cases}x^{}\log(x^{})-(1+x^{})\log(1+x^{})&{\text{if }}x^{}>0\\0&{\text{if }}x^{}=0\end{cases}}$	$\mathbb {R} _{+}$

参考文献

^ “Legendre Transform”. 2012年9月13日閲覧。
^ “Legendre transformation and information geometry”. 2015年7月13日閲覧。
^ Phelps, Robert (1991). Convex Functions, Monotone Operators and Differentiability (2 ed.). Springer. p. 42. ISBN 0-387-56715-1
^ Bauschke, Heinz H.; Goebel, Rafal; Lucet, Yves; Wang, Xianfu (2008). “The Proximal Average: Basic Theory”. SIAM Journal on Optimization 19 (2): 766. doi:10.1137/070687542.
^ Ioffe, A.D. and Tichomirov, V.M. (1979), Theorie der Extremalaufgaben. Deutscher Verlag der Wissenschaften. Satz 3.4.3
^ Borwein, Jonathan; Lewis, Adrian (2006). Convex Analysis and Nonlinear Optimization: Theory and Examples (2 ed.). Springer. pp. 50–51. ISBN 978-0-387-29570-1

Arnol'd, Vladimir Igorevich (1989). Mathematical Methods of Classical Mechanics (Second ed.). Springer. ISBN 0-387-96890-3. MR997295
Rockafellar, R. Tyrell (1970). Convex Analysis. Princeton: Princeton University Press. ISBN 0-691-01586-4. MR0274683