Màquina de vectors de suport estructura

De la Viquipèdia, l'enciclopèdia lliure

La màquina de vectors de suport estructurat és un algorisme d'aprenentatge automàtic que generalitza el classificador de la màquina de vectors de suport (SVM). Mentre que el classificador SVM admet classificació binària, classificació multiclasse i regressió, l'SVM estructurat permet l'entrenament d'un classificador per a etiquetes de sortida estructurades generals.[1]

Com a exemple, una instància de mostra pot ser una frase en llenguatge natural i l'etiqueta de sortida és un arbre d'anàlisi anotat. L'entrenament d'un classificador consisteix a mostrar parells de mostres correctes i parells d'etiquetes de sortida. Després de l'entrenament, el model SVM estructurat permet predir per a noves instàncies de mostra l'etiqueta de sortida corresponent; és a dir, donada una oració en llenguatge natural, el classificador pot produir l'arbre d'anàlisi més probable.[2]

Per a un conjunt de instàncies de formació , d'un espai mostral i l'espai d'etiquetes , l'SVM estructurat minimitza la següent funció de risc regularitzada.

La funció és convexa perquè el màxim d'un conjunt de funcions afins és convex. La funció mesura una distància a l'espai de l'etiqueta i és una funció arbitrària (no necessàriament una mètrica) satisfactòria i . La funció és una funció característica, que extreu algun vector de característica d'una mostra i etiqueta donades. El disseny d'aquesta funció depèn molt de l'aplicació.

Com que la funció de risc regularitzada anterior no és diferenciable, sovint es reformula en termes d'un programa quadràtic introduint una variable slack. per a cada mostra, cadascuna representa el valor del màxim.

En el moment de la prova, només una mostra es coneix, i una funció de predicció l'assigna a una etiqueta prevista des de l'espai d'etiquetes . Per a SVM estructurats, donat el vector obtinguda de l'entrenament, la funció de predicció és la següent.[3]

Per tant, el maximitzador de l'espai de l'etiqueta és l'etiqueta prevista. La resolució d'aquest maximitzador és l'anomenat problema d'inferència i similar a fer una predicció a posterior màxima (MAP) en models probabilístics. En funció de l'estructura de la funció , resoldre el maximitzador pot ser un problema difícil.[4]


Referències[modifica]

  1. Manju, S.; Helenprabha, K. «RETRACTED ARTICLE: A structured support vector machine for hyperspectral satellite image segmentation and classification based on modified swarm optimization approach» (en anglès). Journal of Ambient Intelligence and Humanized Computing, 12, 3, 01-03-2021, pàg. 3659–3668. DOI: 10.1007/s12652-019-01643-1. ISSN: 1868-5145.
  2. Liu, Xin; Yi, Grace Y.; Bauman, Glenn; He, Wenqing «Ensembling Imbalanced-Spatial-Structured Support Vector Machine» (en anglès). Econometrics and Statistics, 17, 01-01-2021, pàg. 145–155. DOI: 10.1016/j.ecosta.2020.02.003. ISSN: 2452-3062.
  3. «Applications of Support Vector Machines (SVM)» (en anglès). https://iq.opengenus.org,+07-05-2020.+[Consulta: 24 març 2023].
  4. Witoonchart, Peerajak; Chongstitvatana, Prabhas «Application of structured support vector machine backpropagation to a convolutional neural network for human pose estimation». Neural Networks: The Official Journal of the International Neural Network Society, 92, 2017-08, pàg. 39–46. DOI: 10.1016/j.neunet.2017.02.005. ISSN: 1879-2782. PMID: 28433431.