16- TensorFlow实现线性回归和逻辑回归 (TensorFlow系列) (深度学习)
创始人
2025-05-28 09:06:08
0

知识要点

线性回归要点:

  • 生成线性数据: x = np.linspace(0, 10, 20) + np.random.rand(20)
  • 画点图: plt.scatter(x, y)
  • TensorFlow定义变量: w = tf.Variable(np.random.randn() * 0.02)
  • tensor 转换为 numpy数组: b.numpy()
  • 定义优化器: optimizer = tf.optimizers.SGD()
  • 定义损失:  tf.reduce_mean(tf.square(y_pred - y_true))   # 求均值
  • 自动微分: tf.GradientTape()
  • 计算梯度: gradients = g.gradient(loss, [w, b])
  • 更新w, b: optimizer.apply_gradients(zip(gradients, [w, b]))

逻辑回归要点:

  • 查看安装文件: pip list
  • 聚类数据生成器: make_blobs
  • 生成聚类数据: data, target = make_blobs(centers = 3)
  • 转换为tensor 数据: x = tf.constant(data, dtype = tf.float32)
  • 定义tensor变量: B = tf.Variable(0., dtype = tf.float32)
  • 矩阵运算: tf.matmul(x, W)
  • 返回值长度为batch_size的一维Tensor: tf.sigmoid(linear)
  • 调整形状: y_pred = tf.reshape(y_pred, shape = [100])
  • tf.clip_by_value(A, min, max):输入一个张量A,把A中的每一个元素的值都压缩在min和max之间。
  • 求均值: tf.reduce_mean()
  • 定义优化器: optimizer = tf.optimizers.SGD()
  • 计算梯度: gradients = g.gradient(loss, [W, B])    # with tf.GradientTape() as g
  • 迭代更新W, B: optimizer.apply_gradients(zip(gradients, [W, B]))
  • 准确率计算: (y_ == y_true).mean()

about parameter loss : 深度学习之——损失函数(loss)


1 使用tensorflow实现 线性回归

实现一个算法主要从以下三步入手:

  1. 找到这个算法的预测函数, 比如线性回归的预测函数形式为:y = wx + b,

  2. 找到这个算法的损失函数 , 比如线性回归算法的损失函数为最小二乘法

  3. 找到让损失函数求得最小值的时候的系数, 这时一般使用梯度下降法.

使用TensorFlow实现算法的基本套路:

  1. 使用TensorFlow中的变量将算法的预测函数, 损失函数定义出来.

  2. 使用梯度下降法优化器求损失函数最小时的系数

  3. 分批将样本数据投喂给优化器,找到最佳系数

1.1 导包

import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

1.2 生成线性数据

# 生成线性数据
x = np.linspace(0, 10, 20) + np.random.rand(20)
y = np.linspace(0, 10, 20) + np.random.rand(20)
plt.scatter(x, y)

1.3 初始化斜率变量

# 把w,b 定义为变量
w = tf.Variable(np.random.randn() * 0.02)
b = tf.Variable(0.)
print(w.numpy(), b.numpy())  # -0.031422824  0.0

1.4 定义线性模型和损失函数

# 定义线性模型
def linear_regression(x):return w * x +b# 定义损失函数
def mean_square_loss(y_pred, y_true):return tf.reduce_mean(tf.square(y_pred - y_true))

1.5 定义优化过程

# 定义优化器
optimizer = tf.optimizers.SGD()
# 定义优化过程
def run_optimization():# 把需要求导的计算过程放入gradient pape中执行,会自动实现求导with tf.GradientTape() as g:pred = linear_regression(x)loss = mean_square_loss(pred, y)# 计算梯度gradients = g.gradient(loss, [w, b])# 更新w, boptimizer.apply_gradients(zip(gradients, [w, b]))

1.6 执行迭代训练过程

# 训练
for step in range(5000):run_optimization()   # 持续迭代w, b# z展示结果if step % 100 == 0:pred = linear_regression(x)loss = mean_square_loss(pred, y)print(f'step:{step}, loss:{loss}, w:{w.numpy()}, b: {b.numpy()}')

 1.7 线性拟合

linear = LinearRegression()  # 线性回归
linear.fit(x.reshape(-1, 1), y)plt.scatter(x, y)
x_test = np.linspace(0, 10, 20).reshape(-1, 1)
plt.plot(x_test, linear.coef_ * x_test + linear.intercept_, c='r')  # 画线
plt.plot(x_test, w.numpy() * x_test + b.numpy(), c='g', lw=10, alpha=0.5)  # 画线

2. 使用TensorFlow实现 逻辑回归

实现逻辑回归的套路和实现线性回归差不多, 只不过逻辑回归的目标函数和损失函数不一样而已.

使用tensorflow实现逻辑斯蒂回归

  1. 找到预测函数 : 1/(1 + e^{-z})
  2. 找到损失函数 : -(y_true * log(y_pred) + (1 - y_true)log(1 - y_pred))
  3. 梯度下降法求损失最小的时候的系数

2.1 导包

import  tensorflow as tf
from sklearn.datasets import make_blobs
import numpy as np
import matplotlib.pyplot as plt
  • 聚类数据生成器: make_blobs

2.2 描聚类数据点

data, target = make_blobs(centers = 2)
plt.scatter(data[:, 0] , data[:, 1], c = target)
x = data.copy()
y = target.copy()
print(x.shape, y.shape)  # (100, 2) (100,)

 

 2.3 数据转换为张量 (tensor)

  • 可以对目标值进行one_hot 编码: y  = tf.one_hot(y, depth=2)    # 可以添加, 进行优化
x = tf.constant(data, dtype = tf.float32)
y = tf.constant(target, dtype = tf.float32)

2.4 定义预测函数 (初始化w, b)

# 定义预测变量
W = tf.Variable(np.random.randn(2, 1) * 0.2, dtype = tf.float32)
B = tf.Variable(0., dtype = tf.float32)

2.5 定义目标函数

def sigmoid(x):linear = tf.matmul(x, W) + Breturn tf.nn.sigmoid(linear)

2.6 定义损失

# 定义损失
def cross_entropy_loss(y_true, y_pred):# y_pred 是概率,存在可能性是0, 需要进行截断y_pred = tf.reshape(y_pred, shape = [100])y_pred = tf.clip_by_value(y_pred, 1e-9, 1)return tf.reduce_mean(-(tf.multiply(y_true, tf.math.log(y_pred)) + tf.multiply((1 - y_pred),tf.math.log(1 - y_pred))))

2.7 定义优化器

# 定义优化器
optimizer = tf.optimizers.SGD()def run_optimization():with tf.GradientTape() as g:# 计算预测值pred = sigmoid(x)  # 结果为概率loss = cross_entropy_loss(y, pred)#计算梯度gradients = g.gradient(loss, [W, B])# 更新W, Boptimizer.apply_gradients(zip(gradients, [W, B]))

2.8 定义准确率

  • 准确率定义为二分类
# 计算准确率
def accuracy(y_true, y_pred):# 需要把概率转换为类别# 概率大于0.5 可以判断为正例y_pred = tf.reshape(y_pred, shape = [100])y_ = y_pred.numpy() > 0.5y_true = y_true.numpy()return (y_ == y_true).mean()

2.9 开始训练

# 定义训练过程
for i in range(5000):run_optimization()if i % 100 == 0:pred = sigmoid(x)acc = accuracy(y, pred)loss = cross_entropy_loss(y, pred)print(f'训练次数:{i}, 准确率: {acc}, 损失: {loss}')

相关内容

热门资讯

疯抢43轮!溢价33.9%!刚... 就在刚刚,江宁两幅低密地块成功出让!其中,三山G50地块热度非常高,该地块是三山板块近10年来首次推...
57岁湖北前首富骤然身亡,家居... wumiancaijing.com / 几个月前才喊着“既没有退休打算,更没想过逃避责任”的汪林朋...
布米普特拉北京投资基金管理有限... 当地时间七月二十九日,美国液化天然气(LNG)出口领域的新锐巨头Venture Global宣布成功...
国泰A500ETF半年蒸发百亿... 2025年中,公募总规模突破34万亿元,同比增加3万亿,其中指数基金的规模净增了2.17万亿元,是主...
原创 美... 前言 近日,美国财政部长贝森特在瑞典斯德哥尔摩的美中贸易谈判中公开透露。 美国国会正在审议一项针对...
年入250亿,波司登让中产又爱... 文 | 本原财经 中产的心头好,“羽绒服之王”波司登交卷了:2025财年,营收首次达到259.02...
创业板指跌逾2%!下跌个股近4... 【大河财立方消息】7月30日午后,指数走弱,创业板指下挫跌逾2.00%,沪指跌0.16%,深成指跌1...
纺织行业上市公司董秘PK:太平... 来源:新浪证券 数据显示,截止7月29日,A股市场共有5817家上市公司。董秘作为连接投资者与上市公...
文远知行Robotaxi获沙特... 本报讯 (记者袁传玺)7月28日,广州文远知行科技有限公司(以下简称“文远知行”,Nasdaq:WR...
新三板创新层公司九州量子大宗交... 每经讯,2025年7月30日,新三板创新层公司九州量子(837638,收盘价:1.64元)发生一笔大...
美国将对欧盟葡萄酒征收15%关... 经过紧张的谈判和不断升级的猜测,美国最终确认对所有进入美国市场的欧盟商品(包括葡萄酒、烈酒和利口酒)...
阿维塔陈卓:拟明年下半年推出与... 凤凰网科技讯 7月30日,阿维塔科技总裁陈卓在中国长安汽车集团有限公司正式成立后首场媒体沟通会上透露...
累计融资5亿! 广州跑出超级独... 对话 | 铅笔道CEO 王方 撰稿 | 铅笔道编辑 赵松格 外卖赛道有美团,生物医药界也有“美团”?...
美国股市今夏是否会过热?专家建... 财联社7月30日讯(编辑 黄君芝)对金融市场来说,今年夏天是一个复杂的时期。尽管市场一直在猜测未来会...
2025“数通链谷”杯上海市区... 7月30日,2025“数通链谷”杯上海市区块链产业应用职工劳动和技能竞赛在上海市静安区市北高新园区数...
李想回忆被赶出公司:站在对方的... 近日,李想在与鲁豫的对话中,回忆人生低谷:2008年,自己曾被创业伙伴联合逼宫,汽车之家面临严重的财...
中证香港300银行指数报118... 金融界7月30日消息,A股三大指数收盘涨跌不一,中证香港300银行指数 (H300银行,H30324...
凯德北京投资基金管理有限公司:... 7月15日,A股上演惊险过山车行情。沪指早盘冲高至3278点后快速回落,最终微涨0.17%报3241...
美财政部长称中国如继续购买俄罗... 7月30日,外交部发言人郭嘉昆主持例行记者会。有记者问:美国财政部长表示,如果中国继续购买俄罗斯石油...