ChainerでVariableにラベル情報を付加する方法

2016年03月25日

概要

n次元ベクトルのVariableにone-hotなラベルベクトルのVariableを付加する方法
追記あり

はじめに

Adversarial Autoencoderでは教師あり学習の際、隠れ変数ベクトルにラベルベクトルを付加して次元拡張し、新たなベクトルを作ります。

たとえば隠れ変数がn次元ベクトル、ラベル情報がm次元ベクトルだった場合、新しいベクトルはn+m次元になります。

Variableに変換する前のnumpy配列であれば、numpy.appendすればいいだけなのですが、今回はラベルを付加する場所がネットワークの中間層なため、Chainerで適切に誤差逆伝播できるような付加手法が必要になりました。

例

x = [0.5, 0.7]
label = [0, 0, 1, 0, 0, 0, 0]

new_x = [0.5, 0.7, 0, 0, 1, 0, 0, 0, 0]

結合関数

今回は２つのベクトルを結合するChainerの関数を作ります。

コードは以下のようになりました。

class Adder(function.Function):
	def check_type_forward(self, in_types):
		n_in = in_types.size()
		type_check.expect(n_in == 2)
		x_type, label_type = in_types

		type_check.expect(
			x_type.dtype == np.float32,
			label_type.dtype == np.float32,
			x_type.ndim == 2,
			label_type.ndim == 2,
		)

	def forward(self, inputs):
		xp = cuda.get_array_module(inputs[0])
		x, label = inputs
		n_batch = x.shape[0]
		output = xp.empty((n_batch, x.shape[1] + label.shape[1]), dtype=xp.float32)
		output[:,:x.shape[1]] = x
		output[:,x.shape[1]:] = label
		return output,

	def backward(self, inputs, grad_outputs):
		x, label = inputs
		return grad_outputs[0][:,:x.shape[1]], grad_outputs[0][:,x.shape[1]:]

def add_label(x, label):
	return Adder()(x, label)

Variableを入力すると拡張されたVariableが返ってきます。

new_variable = add_label(x_variable, label_variable)

backward時、ラベル情報は定数なので勾配を伝播する必要はないのですが、入力の順番が入れ替わっても対応できるようにするため余計なことはしないようにしました。

new_variable = add_label(x_variable, label_variable)
new_variable = add_label(label_variable, x_variable)	# 本質的には同じ

追記

後から知ったのですがChainerにはVariableを結合するconcat関数があります。

new_variable = F.concat((x_variable, label_variable), axis=1)

これを使えば上記の手法は必要ありません。

またVAEではconcatしないラベルの付加手法を使っていますので紹介しておきます。

隠れ層のユニット数が100、入力ベクトルが50次元、ラベルが10次元の場合、

merge_layer_x = L.Linear(50, 100)
merge_layer_y = L.Linear(10, 100)

のようなレイヤーを作り、

merged_vector = merge_layer_x(x_variable) + merge_layer_y(label_variable)

のようにしてから隠れ層に入力します。

ちなみにmerge_layer_yはnobias=Trueにすべきではないかと思いましたが、TrueにするとVAEでは性能が低下しました。