当前位置：首页 > news >正文

别再死记硬背WideDeep了！用TensorFlow 2.x手把手复现Google Play的推荐模型（附源码）

news 2026/7/20 5:27:16

从零实现Wide&Deep推荐模型：TensorFlow 2.x实战指南

在推荐系统领域，Google提出的Wide&Deep模型架构已经成为工业界的经典范式。但大多数教程仅停留在理论讲解层面，当开发者真正动手实现时，往往会遇到特征工程适配、联合训练策略选择、超参数调优等一系列工程难题。本文将带您用TensorFlow 2.x完整复现该模型，重点解决以下实际问题：

如何正确处理混合类型特征（连续值与离散值）
Wide部分与Deep部分的优化器差异化配置技巧
动态调整学习率的工程实践方案
模型训练不稳定的常见排查方法

1. 环境准备与数据预处理

1.1 基础环境配置

推荐使用Python 3.8+和TensorFlow 2.6+环境，以下是必需的依赖包：

!pip install tensorflow==2.8.0 !pip install pandas scikit-learn

验证TensorFlow版本：

import tensorflow as tf print(tf.__version__) # 应输出2.8.0

1.2 模拟数据生成

由于Google Play的真实数据不可获取，我们构造一个模拟数据集演示完整流程：

import pandas as pd import numpy as np # 生成10万条样本数据 num_samples = 100000 data = { 'user_id': np.random.randint(1, 10000, num_samples), 'item_id': np.random.randint(1, 5000, num_samples), 'user_click_history': np.random.randint(1, 100, (num_samples, 10)), # 用户最近10次点击 'item_category': np.random.choice(['游戏', '工具', '社交', '教育'], num_samples), 'user_avg_rating': np.random.uniform(1, 5, num_samples), # 连续特征 'item_price': np.random.lognormal(3, 1, num_samples) # 连续特征 } df = pd.DataFrame(data) df['click_label'] = (df['user_avg_rating'] * 0.2 + np.log(df['item_price']) * (-0.1) + np.random.normal(0, 0.1, num_samples)) > 0.5

1.3 特征工程处理

不同类型的特征需要差异化处理：

特征类型	处理方法	输出维度
用户ID	Embedding	64
物品ID	Embedding	64
点击历史	多值Embedding	32
物品类别	One-Hot	4
用户评分	MinMax归一化	1
物品价格	Log归一化	1

连续特征标准化实现：

from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() df['user_avg_rating_norm'] = scaler.fit_transform(df[['user_avg_rating']]) df['item_price_log_norm'] = np.log(df['item_price']) df['item_price_log_norm'] = scaler.fit_transform(df[['item_price_log_norm']])

2. 模型架构实现

2.1 输入层设计

使用TensorFlow Feature Columns API定义输入：

import tensorflow as tf # 离散特征 user_id = tf.feature_column.categorical_column_with_identity('user_id', num_buckets=10000) item_id = tf.feature_column.categorical_column_with_identity('item_id', num_buckets=5000) item_category = tf.feature_column.categorical_column_with_vocabulary_list( 'item_category', ['游戏', '工具', '社交', '教育']) # 连续特征 user_rating = tf.feature_column.numeric_column('user_avg_rating_norm') item_price = tf.feature_column.numeric_column('item_price_log_norm') # 多值序列特征 click_history = tf.feature_column.sequence_categorical_column_with_identity( 'user_click_history', num_buckets=100)

2.2 Wide部分实现

重点构建有效的交叉特征：

# 基础特征 wide_columns = [ tf.feature_column.indicator_column(item_category), # 重要特征交叉 tf.feature_column.crossed_column( ['user_id', 'item_id'], hash_bucket_size=int(1e6)), tf.feature_column.crossed_column( [item_category, 'user_id'], hash_bucket_size=10000) ]

2.3 Deep部分实现

构建深度神经网络分支：

deep_columns = [ # Embedding特征 tf.feature_column.embedding_column(user_id, dimension=64), tf.feature_column.embedding_column(item_id, dimension=64), tf.feature_column.embedding_column(click_history, dimension=32), # 连续特征 user_rating, item_price ]

2.4 完整模型组装

def build_model(): # 输入层 inputs = { 'user_id': tf.keras.Input(shape=(1,), dtype='int32', name='user_id'), 'item_id': tf.keras.Input(shape=(1,), dtype='int32', name='item_id'), 'user_click_history': tf.keras.Input(shape=(10,), dtype='int32', name='user_click_history'), 'item_category': tf.keras.Input(shape=(1,), dtype='string', name='item_category'), 'user_avg_rating_norm': tf.keras.Input(shape=(1,), dtype='float32', name='user_avg_rating_norm'), 'item_price_log_norm': tf.keras.Input(shape=(1,), dtype='float32', name='item_price_log_norm') } # Wide部分 wide = tf.keras.layers.DenseFeatures(wide_columns)(inputs) wide = tf.keras.layers.Dense(1, activation='sigmoid')(wide) # Deep部分 deep = tf.keras.layers.DenseFeatures(deep_columns)(inputs) deep = tf.keras.layers.Dense(256, activation='relu')(deep) deep = tf.keras.layers.Dense(128, activation='relu')(deep) deep = tf.keras.layers.Dense(64, activation='relu')(deep) deep = tf.keras.layers.Dense(1, activation='sigmoid')(deep) # 联合输出 output = tf.keras.layers.add([0.5 * wide, 0.5 * deep]) model = tf.keras.Model(inputs=inputs, outputs=output) return model

3. 训练策略与调优

3.1 差异化优化器配置

model = build_model() # Wide部分使用FTRL优化器 wide_optimizer = tf.keras.optimizers.Ftrl( learning_rate=0.01, l1_regularization_strength=0.001, l2_regularization_strength=0.001 ) # Deep部分使用Adam优化器 deep_optimizer = tf.keras.optimizers.Adam(learning_rate=0.001) # 自定义训练循环 @tf.function def train_step(inputs, labels): with tf.GradientTape(persistent=True) as tape: predictions = model(inputs) loss = tf.keras.losses.binary_crossentropy(labels, predictions) # 分别计算梯度 wide_vars = [var for var in model.trainable_variables if 'dense_features' in var.name] deep_vars = [var for var in model.trainable_variables if 'dense_features' not in var.name] wide_grads = tape.gradient(loss, wide_vars) deep_grads = tape.gradient(loss, deep_vars) # 分别应用梯度 wide_optimizer.apply_gradients(zip(wide_grads, wide_vars)) deep_optimizer.apply_gradients(zip(deep_grads, deep_vars)) return loss

3.2 动态学习率调整

实现学习率warmup策略：

class WarmupLearningRateSchedule( tf.keras.optimizers.schedules.LearningRateSchedule): def __init__(self, initial_learning_rate, warmup_steps): self.initial_learning_rate = initial_learning_rate self.warmup_steps = warmup_steps def __call__(self, step): return tf.cond( step < self.warmup_steps, lambda: self.initial_learning_rate * (step / self.warmup_steps), lambda: self.initial_learning_rate )

3.3 训练监控与评估

使用TensorBoard记录关键指标：

# 在模型编译时添加回调 callbacks = [ tf.keras.callbacks.TensorBoard(log_dir='./logs'), tf.keras.callbacks.EarlyStopping(patience=3) ] model.compile( optimizer='adam', # 此处仅为占位，实际使用自定义训练循环 loss='binary_crossentropy', metrics=['accuracy', tf.keras.metrics.AUC()] ) history = model.fit( train_dataset, validation_data=val_dataset, epochs=20, callbacks=callbacks )

4. 生产环境部署建议

4.1 模型导出与优化

# 保存完整模型 model.save('wide_deep_model', save_format='tf') # 转换为TFLite格式（移动端部署） converter = tf.lite.TFLiteConverter.from_saved_model('wide_deep_model') converter.optimizations = [tf.lite.Optimize.DEFAULT] tflite_model = converter.convert() with open('wide_deep.tflite', 'wb') as f: f.write(tflite_model)

4.2 性能优化技巧

特征预处理加速：使用TensorFlow Transform进行离线特征处理
模型剪枝：对Embedding层应用稀疏训练
量化部署：采用FP16或INT8量化减小模型体积

# 模型剪枝示例 pruning_params = { 'pruning_schedule': tfmot.sparsity.keras.ConstantSparsity( 0.5, begin_step=1000, frequency=100) } pruned_model = tfmot.sparsity.keras.prune_low_magnitude( model, **pruning_params)