一可软件 一可软件 Outils par lots
Français

线性回归计算器

在线计算线性回归方程、相关系数和散点图,支持手动输入、CSV导入和批量数据分析

Consultez les informations et actions de l’outil. Consultez les articles et catégories.
序号
X值
Y值
操作

Cet élément est affiché dans la langue actuelle.

软件使用说明

  1. 选择数据输入方式:提供三种输入方式 - 手动输入适合少量数据,CSV文件导入适合批量处理(自动检测逗号、Tab、分号分隔符),文本批量输入适合复制粘贴数据。
  2. 输入数据点:
    • 手动输入:在表格中逐个输入X、Y坐标值,可添加或删除数据行。支持键盘快捷操作:Enter键快速跳转到下一个输入框或自动添加新行,Tab键自动扩展数据行。
    • CSV导入:上传包含X、Y列的CSV/TSV/TXT文件,支持多文件批量处理。系统自动识别分隔符(逗号、Tab、分号)和表头。
    • 文本输入:每行输入一对X,Y值,支持逗号、空格、Tab、分号分隔,可直接从Excel复制粘贴。
  3. 选择回归模型:
    • 线性回归:y = mx + b,适用于线性关系数据
    • 二次多项式:y = ax² + bx + c,适用于抛物线趋势数据
    • 三次多项式:y = ax³ + bx² + cx + d,适用于S形或复杂曲线数据
    • 自定义阶数:支持2~10阶多项式拟合
    • 多模型对比:同时计算1~3阶模型并对比R²、调整R²和标准误差,帮助选择最优模型
  4. 配置计算参数:
    • 显示选项:选择是否显示详细计算步骤、散点图、置信区间、残差分析、异常值检测和描述性统计
    • 精度设置:选择保留小数位数(2-8位)
    • 置信水平:选择90%、95%或99%置信水平
  5. 预测功能(可选):启用后输入一个或多个X值(逗号分隔),系统自动计算对应的预测Y值及置信区间。
  6. 开始计算:点击"开始计算回归分析"按钮,系统将自动进行回归分析并显示结果。
  7. 查看结果:结果包括回归方程、核心统计指标(R²、调整R²、F统计量、p值、标准误差)、散点图(含回归曲线和置信带)、模型诊断、异常值标记、预测结果等。鼠标悬停散点图上的数据点可查看坐标值。
  8. 导出与下载:
    • 下载完整分析报告(TXT格式)
    • 下载计算数据(CSV格式,含预测值和残差)
    • 导出散点图为PNG或SVG格式图片
    • 批量处理时提供汇总报告下载

常见问题

答:进行线性回归分析至少需要2个数据点,多项式回归则需要数据点数量大于多项式阶数。建议使用10个以上的数据点以获得更可靠的结果。数据点越多,回归分析的准确性和统计检验的可信度越高。

答:相关系数r的取值范围为-1到1。r接近1表示强正相关,r接近-1表示强负相关,r接近0表示无线性相关。通常|r|>0.7为强相关,0.3<|r|<0.7为中等相关,|r|<0.3为弱相关。

答:R²(决定系数)表示模型能解释因变量变异的百分比,取值0到1,越接近1拟合越好。调整R²在R²基础上考虑了模型复杂度的惩罚,更适合比较不同阶数的模型。F统计量用于检验回归模型整体是否显著,对应的p值越小(通常<0.05),说明模型越有统计学意义。

答:建议先使用线性回归,观察散点图和残差图。如果残差呈现明显的曲线模式,说明线性模型不够,可尝试多项式回归。使用"多模型对比"功能可同时查看不同阶数模型的拟合效果,选择调整R²最高且标准误差最小的模型。注意避免过拟合:阶数过高可能导致模型在新数据上表现不佳。

答:CSV文件应包含两列数据,首列为X值,第二列为Y值。系统自动识别分隔符(逗号、Tab、分号)和表头。支持.csv、.tsv、.txt格式文件。可直接从Excel导出CSV文件或复制粘贴到文本输入模式中使用。

答:残差是实际Y值与预测Y值的差值。残差分析通过残差图可以检验回归模型的适用性。理想情况下,残差应随机分布在零线附近,无明显模式。如残差呈现曲线模式,可能需要使用更高阶的多项式模型;如残差呈喇叭形,可能存在异方差性问题。本工具同时提供残差统计信息(均值、标准差、最大最小值)。

答:本工具使用2σ(两倍标准差)标准检测异常值。当某个数据点的残差绝对值超过残差标准差的2倍时,该点被标记为异常值。异常值会在散点图中以红色高亮显示,并在异常值检测表格中列出详细信息(坐标、残差、Z分数)。您可以点击"剔除异常值后重新计算"按钮,查看去除异常值后的回归结果。

答:置信区间基于t分布精确计算,表示参数真实值可能落在的范围。95%置信区间意味着在重复抽样中,95%的区间会包含真实参数值。本工具提供斜率和截距的置信区间,以及散点图上的置信带可视化。预测功能中也会给出每个预测值的置信区间,帮助评估预测的不确定性。

答:在计算设置下方勾选"启用预测功能",然后在输入框中输入一个或多个X值(用逗号分隔)。计算完成后,结果区域会显示每个X值对应的预测Y值以及置信区间的上下限。预测区间考虑了模型误差和新观测的不确定性,比置信区间更宽。

答:计算完成后,散点图下方提供两个导出按钮:"导出PNG"生成高清位图,适合PPT和网页使用;"导出SVG"生成矢量图,适合论文和印刷品,可无损缩放。图表会包含数据点、回归曲线、异常值标记和图例信息。