Effective hyperparameter optimization using Nelder-Mead method in deep learning

Table 10 Hyperparameters of the age/gender classification CNN

Name	Description	Range
x ₁	Learning rate (\(= 0.1^{x_{1}}\phantom {\dot {i}\!}\))	[ 1,4]
x ₂	Momentum (\(= 1 - 0.1^{x_{2}}\phantom {\dot {i}\!}\))	[ 0.5,2]
x ₃	L2 weight decay	[ 0.001,0.01]
x ₄	Dropout 1	[ 0.4,0.6]
x ₅	Dropout 2	[ 0.4,0.6]
\(x_{6}^{*}\)	FC 1 units	[ 512,1024]
\(x_{7}^{*}\)	FC 2 units	[ 256,512]
x ₈	Conv 1 initialization deviation	[ 0.01,0.05]
x ₉	Conv 2 initialization deviation	[ 0.01,0.05]
x ₁₀	Conv 3 initialization deviation	[ 0.01,0.05]
x ₁₁	FC 1 initialization deviation	[ 0.001,0.01]
x ₁₂	FC 2 initialization deviation	[ 0.001,0.01]
x ₁₃	FC 3 initialization deviation	[ 0.001,0.01]
x ₁₄	Conv 1 bias	[ 0,1]
x ₁₅	Conv 2 bias	[ 0,1]
x ₁₆	Conv 3 bias	[ 0,1]
x ₁₇	FC 1 bias	[ 0,1]
x ₁₈	FC 2 bias	[ 0,1]
\(x_{19}^{*}\)	Normalization 1 localsize (=2x ₁₉+3)	[ 0,2]
\(x_{20}^{*}\)	Normalization 2 localsize (=2x ₂₀+3)	[ 0,2]
x ₂₁	Normalization 1 alpha	[ 0.0001,0.0002]
x ₂₂	Normalization 2 alpha	[ 0.0001,0.0002]
x ₂₃	Normalization 1 beta	[ 0.5,0.95]
x ₂₄	Normalization 2 beta	[ 0.5,0.95]