Fundamental computational and machine learning (ML) models that can be applied to BTE design
可应用于 BTE 设计的基本计算和机器学习 (ML) 模型
可应用于 BTE 设计的基本计算和机器学习 (ML) 模型
ML is a data-driven artificial intelligence (AI) technology that involves creating predictive models by learning from existing data. It operates by fitting models to a small set of 'training data' with known outcomes to develop its predictive capability, and then the models are applied to 'test data' to make generalized predictions about unseen data [128]. ML can be broadly categorized into supervised learning, unsupervised learning, and reinforcement learning. In supervised learning, each training dataset (scaffold geometry, material properties, etc.) is associated with corresponding outputs (permeability, hydrophobicity, etc.) as its labels. Supervised learning learns the input–output relationships from the training data, and therefore is 'supervised' to predict the outputs of the testing data [129].
ML 是一种数据驱动的人工智能 (AI) 技术,涉及通过学习现有数据来创建预测模型。它通过将模型拟合到一小组具有已知结果的“训练数据”来开发其预测能力,然后将模型应用于“测试数据”以对未见过的数据进行广义预测[ 128 ]。机器学习可以大致分为监督学习、无监督学习和强化学习。在监督学习中,每个训练数据集(支架几何形状、材料属性等)都与相应的输出(渗透性、疏水性等)相关联作为其标签。监督学习从训练数据中学习输入输出关系,因此被“监督”以预测测试数据的输出[ 129 ]。
ML 是一种数据驱动的人工智能 (AI) 技术,涉及通过学习现有数据来创建预测模型。它通过将模型拟合到一小组具有已知结果的“训练数据”来开发其预测能力,然后将模型应用于“测试数据”以对未见过的数据进行广义预测[ 128 ]。机器学习可以大致分为监督学习、无监督学习和强化学习。在监督学习中,每个训练数据集(支架几何形状、材料属性等)都与相应的输出(渗透性、疏水性等)相关联作为其标签。监督学习从训练数据中学习输入输出关系,因此被“监督”以预测测试数据的输出[ 129 ]。
(i) A decision tree is a supervised learning algorithm for classification and regression. In a tree-like model of decisions, each internal node represents a test on an attribute, each leaf node indicates a class label or decision based on the attributes, and each branch represents the outcome of a test [130].
(i) 决策树是一种用于分类和回归的监督学习算法。在决策的树状模型中,每个内部节点代表对属性的测试,每个叶节点指示基于属性的类标签或决策,每个分支代表测试的结果[ 130 ]。
(i) 决策树是一种用于分类和回归的监督学习算法。在决策的树状模型中,每个内部节点代表对属性的测试,每个叶节点指示基于属性的类标签或决策,每个分支代表测试的结果[ 130 ]。
(ii) A support vector machine (SVM) is a supervised learning method for classification, regression, and outlier detection. SVMs work by identifying the hyperplane that optimally divides a dataset into distinct classes with high robustness and a low risk of overfitting [130].
(ii) 支持向量机 (SVM) 是一种用于分类、回归和异常值检测的监督学习方法。 SVM 的工作原理是识别超平面,该超平面可以将数据集最佳地划分为具有高鲁棒性和低过拟合风险的不同类别 [ 130 ]。
(ii) 支持向量机 (SVM) 是一种用于分类、回归和异常值检测的监督学习方法。 SVM 的工作原理是识别超平面,该超平面可以将数据集最佳地划分为具有高鲁棒性和低过拟合风险的不同类别 [ 130 ]。
Unsupervised learning, by contrast, represents the process of training algorithms with unlabeled data to discover inherent patterns within the input. Finally, reinforcement learning is a method that navigates through uncertain environments by learning from past behaviors to select optimal actions that maximize rewards [129].
相比之下,无监督学习代表了使用未标记数据训练算法以发现输入中固有模式的过程。最后,强化学习是一种通过学习过去的行为来选择最大化奖励的最佳行动来穿越不确定环境的方法[ 129 ]。
相比之下,无监督学习代表了使用未标记数据训练算法以发现输入中固有模式的过程。最后,强化学习是一种通过学习过去的行为来选择最大化奖励的最佳行动来穿越不确定环境的方法[ 129 ]。
Neural networks (NNs) are key architectures in ML, inspired by the biological neural network in the human brain, and are applicable to both supervised and unsupervised learning paradigms. An NN consists of layers of interconnected neurons, which include an input layer, one or more hidden layer(s), and an output layer. The neurons and their connections, associated with different weights, allow each layer to perform transformation on inputs with varying signal strength [130].
神经网络 (NN) 是 ML 的关键架构,其灵感来自于人脑中的生物神经网络,并且适用于监督和无监督学习范例。神经网络由互连的神经元层组成,其中包括输入层、一个或多个隐藏层和输出层。神经元及其连接与不同的权重相关,允许每一层对具有不同信号强度的输入执行转换[ 130 ]。
神经网络 (NN) 是 ML 的关键架构,其灵感来自于人脑中的生物神经网络,并且适用于监督和无监督学习范例。神经网络由互连的神经元层组成,其中包括输入层、一个或多个隐藏层和输出层。神经元及其连接与不同的权重相关,允许每一层对具有不同信号强度的输入执行转换[ 130 ]。
Ensemble learning in ML trains and combines multiple models to solve specific problems, and improves model performance by aggregating their predictions, which effectively reduces overfitting. Random forest is a notable example of ensemble learning that combines multiple decision trees when each tree is trained on independent input datasets. It is known for its high accuracy, ability to process unbalanced or missing data, and ability to identify important classification variables [130].
机器学习中的集成学习训练并组合多个模型来解决特定问题,并通过聚合它们的预测来提高模型性能,从而有效减少过度拟合。随机森林是集成学习的一个著名示例,当每棵树在独立的输入数据集上进行训练时,它会组合多个决策树。它以其高精度、处理不平衡或缺失数据的能力以及识别重要分类变量的能力而闻名[ 130 ]。
机器学习中的集成学习训练并组合多个模型来解决特定问题,并通过聚合它们的预测来提高模型性能,从而有效减少过度拟合。随机森林是集成学习的一个著名示例,当每棵树在独立的输入数据集上进行训练时,它会组合多个决策树。它以其高精度、处理不平衡或缺失数据的能力以及识别重要分类变量的能力而闻名[ 130 ]。