tévék. Konzolok. Projektorok és tartozékok. Technológiák. Digitális TV

Kendall-kritérium példamegoldás. Spearman, Kendall rangkorrelációs együtthatók, Fechner együttható. Miből induljunk ki a vizsgálat témájának, tárgyának, tárgyának, céljának, célkitűzéseinek és hipotézisének meghatározásakor?

Rövid elmélet

A Kendall-féle korrelációs együtthatót akkor használjuk, ha a változókat két ordinális skálán ábrázoljuk, feltéve, hogy nincsenek társított rangok. A Kendall-együttható kiszámítása magában foglalja az egyezések és az inverziók számának számolását.

Ez az együttható határokon belül változik, és a következő képlettel számítják ki:

A számításhoz minden egység a szerint van rangsorolva; egy másik jellemző sora szerint minden ranghoz az adott feletti sorszámot (ezeket -vel jelöljük), az azt követő rangok számát pedig az adott alatti (jellel jelöljük).

Meg lehet mutatni, hogy

és Kendall rangkorrelációs együtthatója úgy írható fel

A nullhipotézis teszteléséhez azon a szignifikancia szinten, hogy az általános Kendall-rang korrelációs együttható nullával egyenlő egy versengő hipotézis mellett, ki kell számítani a kritikus pontot:

hol van a minta mérete;

– a kétoldali kritikus tartomány kritikus pontja, amelyet a Laplace-függvény táblázatából az egyenlőség alapján találunk meg

Ha – nincs ok a nullhipotézis elutasítására. A jellemzők közötti rangkorreláció jelentéktelen.

Ha – a nullhipotézist elutasítjuk. A jellemzők között jelentős rangkorreláció van.

Példa a probléma megoldására

Problémás állapot

A felvételi eljárás során hét, megüresedett pozícióra jelentkező két teszten is részt vett. A vizsgálati eredményeket (pontokban) a táblázat tartalmazza: Teszt 1 2 3 4 5 6 7 1 31 82 25 26 53 30 29 2 21 55 8 27 32 42 26

Jelölt

Számítsa ki a Kendall rangkorrelációs együtthatót két teszt teszteredményei között, és értékelje a szignifikanciáját szinten.

Probléma megoldás

Számítsuk ki a Kendall-együtthatót

1 1 6 0 2 4 3 2 3 3 3 1 4 6 1 2 5 2 2 0 6 5 1 0 7 7 0 0 A faktorkarakterisztika rangsorai szigorúan növekvő sorrendben vannak elrendezve, és párhuzamosan rögzítjük az eredő jellemző megfelelő rangjait. Minden rangnál az azt követő rangok számából számítják ki a nála értékben nagyobb (az oszlopba beírt) és a kisebb értékű (az oszlopba írt) rangokat. 16 5

A mennyiségi vagy minőségi mutatók közötti kapcsolat azonosítására szolgál, amennyiben rangsorolhatók. Az X indikátor értékei növekvő sorrendben és hozzárendelt rangokban jelennek meg. Az Y mutató értékeit rangsoroljuk, és kiszámítjuk a Kendall-korrelációs együtthatót:

Ahol S = PK.

P nagy az Y rangok értéke.

K- az aktuális megfigyeléseket követő megfigyelések teljes száma kisebb az Y rangok értéke. (az egyenlő rangokat nem vesszük figyelembe!)

Ha a vizsgált adatok ismétlődnek (azonos rangúak), akkor a korrigált Kendall-korrelációs együtthatót használjuk a számításokhoz:

t- a kapcsolódó rangok száma az X és Y sorozatban.

19. Miből induljunk ki a vizsgálat témájának, tárgyának, tárgyának, céljának, célkitűzéseinek és hipotézisének meghatározásakor?

A kutatási program általában két részből áll: módszertani és eljárási. Az első tartalmazza a téma relevanciájának indoklását, a probléma megfogalmazását, a tárgy és a tárgy meghatározását, a vizsgálat céljait és célkitűzéseit, az alapfogalmak megfogalmazását (kategorikus apparátus), a vizsgálat tárgyának előzetes rendszerszintű elemzését és a megfogalmazást. egy munkahipotézisről. A második rész feltárja a tanulmány stratégiai felépítését, valamint az elsődleges adatok gyűjtésének és elemzésének tervezését és alapvető eljárásait.

A kutatási téma kiválasztásánál mindenekelőtt a relevanciából kell kiindulni. A relevancia indoklása tartalmazza a tanulás és a problémamegoldás szükségességének és időszerűségének jelzését a tanítás és nevelés elméletének és gyakorlatának továbbfejlesztése érdekében. A jelenlegi kutatások választ adnak a legégetőbb problémákra adott idő a társadalom társadalmi rendjét tükröző kérdések a pedagógiai tudomány felé, feltárják a gyakorlatban lezajló legfontosabb ellentmondásokat. A relevancia kritériuma dinamikus, rugalmas, időfüggő, sajátos és konkrét körülményeket figyelembe véve. A relevancia legáltalánosabb formájában azt a mértéket jellemzi, hogy milyen eltérés van a tudományos ötletek és gyakorlati ajánlások iránti igény (egy adott igény kielégítésére) és azon javaslatok között, amelyeket a tudomány és a gyakorlat jelenleg tud nyújtani.

A kutatás témáját meghatározó legmeggyőzőbb alap a társadalmi rend, amely a legégetőbb, társadalmilag legjelentősebb, sürgős megoldást igénylő problémákat tükrözi. A társadalmi rend megköveteli az indoklást egy adott témakörhöz. Általában ez annak elemzése, hogy egy kérdést milyen mértékben fejlesztettek ki a tudományban.

Ha a pedagógiai gyakorlat elemzéséből következik a társadalmi rend, akkor a tudományos probléma más síkban van. Kifejezi a fő ellentmondást, amelyet a tudomány eszközeivel fel kell oldani. A probléma megoldása általában az a tanulmány célja. A cél egy újrafogalmazott probléma.

A probléma megfogalmazása magában foglalja objektum kiválasztása kutatás. Ez lehet egy pedagógiai folyamat, a pedagógiai valóság egy területe, vagy valamilyen pedagógiai kapcsolat, amely ellentmondást tartalmaz. Más szóval, a tárgy bármi lehet, ami kifejezetten vagy implicit ellentmondást tartalmaz, és problémás helyzetet szül. Egy tárgy az, amire a megismerési folyamat irányul. A kutatás tárgya - egy tárgy része, oldala. Ezek a tárgy gyakorlati vagy elméleti szempontból legjelentősebb tulajdonságai, szempontjai és jellemzői, amelyek közvetlen vizsgálat tárgyát képezik.

A kutatás céljának, tárgyának és tárgyának megfelelően kerül meghatározásra a kutatás feladatok, amelyek általában az ellenőrzést célozzák hipotéziseket. Ez utóbbi elméleti alapokon nyugvó feltételezések halmaza, amelyek igazsága igazolásra szorul.

Kritérium tudományos újdonság alkalmazható a befejezett tanulmányok minőségének értékelésére. Olyan új elméleti és gyakorlati következtetéseket, az oktatás mintáit, szerkezetét és mechanizmusait, tartalmát, elveit és technológiáit jellemzi, amelyek ekkor még nem ismertek és nem rögzítettek a pedagógiai szakirodalomban. A kutatás újszerűsége elméleti és gyakorlati jelentőséggel is bírhat. A kutatás elméleti jelentősége abban rejlik, hogy koncepciót alkotunk, hipotézist, mintát, módszert, modellt kapunk egy probléma, trend, irány azonosítására. A kutatás gyakorlati jelentősége a javaslatok, ajánlások stb. elkészítésében rejlik. Az újdonság, az elméleti és gyakorlati jelentőség kritériumai a kutatás típusától függően változnak, az új ismeretek megszerzésének időpontjától is függnek.

A normalitás feltételezésén alapuló tesztek alkalmazását korlátozó egyik tényező a mintanagyság. Amíg a minta elég nagy (például 100 vagy több megfigyelés), feltételezhető, hogy a mintavételi eloszlás normális, még akkor is, ha nem biztos abban, hogy a változó eloszlása ​​a sokaságban normális. Ha azonban a minta kicsi, akkor ezeket a teszteket csak akkor szabad használni, ha biztos abban, hogy a változó valóban normális eloszlású. Ennek a feltételezésnek a tesztelésére azonban nincs mód kis mintán.

A normalitás feltételezésen alapuló kritériumok alkalmazását a mérési skála is korlátozza (lásd az adatelemzés elemi fogalmai fejezetet). Az olyan statisztikai módszerek, mint a t-próba, regresszió stb., feltételezik, hogy az eredeti adatok folytonosak. Vannak azonban olyan helyzetek, amikor az adatokat egyszerűen rangsorolják (sorrendi skálán mérik), nem pedig pontosan.

Tipikus példát adnak az internetes oldalak értékelései: az első helyet az a webhely foglalja el, ahol a legtöbb látogató, a második helyet a maximális látogatottságú oldal foglalja el a fennmaradó oldalak közül (az oldalak közül ahonnan az első oldalt törölték), stb. Az értékelések ismeretében elmondhatjuk, hogy az egyik oldal látogatottsága nagyobb, mint egy másik oldal látogatottsága, de mennyivel többet nem lehet megmondani. Képzelje el, hogy 5 webhelye van: A, B, C, D, E, amelyek az első 5 helyen vannak. Engedd be aktuális hónap a következő sorrendben voltunk: A, B, C, D, E, és az előző hónapban: D, E, A, B, C. A kérdés az, hogy történt-e jelentős változás az oldalak rangsorában vagy sem? Ebben a helyzetben nyilvánvalóan nem használhatjuk a t-próbát e két adatcsoport összehasonlítására, és áttérünk a konkrét valószínűségszámítások területére (és minden statisztikai teszt tartalmaz valószínűségi számításokat!). Körülbelül a következőképpen érvelünk: mennyire valószínű, hogy a két telephely-elrendezés különbsége pusztán véletlenszerű okokra vezethető vissza, vagy ez a különbség túl nagy, és nem magyarázható puszta véletlenekkel. Ezekben a megbeszélésekben csak a webhelyek rangsorait vagy permutációit használjuk, és semmilyen módon nem használjuk a látogatók számának meghatározott típusát.

Nem paraméteres módszereket használnak kis minták elemzésére és gyenge skálán mért adatokra.

A nemparaméteres eljárások rövid áttekintése

Lényegében minden parametrikus feltételhez van legalább egy nem paraméteres alternatíva.

Általában ezek az eljárások a következő kategóriák egyikébe sorolhatók:

  • különbségi tesztek független mintákhoz;
  • különbségi tesztek függő mintákhoz;
  • a változók közötti függőség mértékének értékelése.

Általánosságban elmondható, hogy az adatelemzésben a statisztikai kritériumok megközelítésének pragmatikusnak kell lennie, és nem szabad felesleges elméleti érveléssel terhelni. A STATISTICA-t futtató számítógéppel egyszerűen több feltételt is alkalmazhat adataira. A módszerek néhány buktatójának ismeretében kísérletezéssel választja ki a megfelelő megoldást. A telek fejlődése teljesen természetes: ha két változó értékét szeretné összehasonlítani, akkor t-próbát használjon. Nem szabad azonban elfelejteni, hogy ez a normalitás és a szórások egyenlőségének feltételezésén alapul az egyes csoportokban. Ezen feltevések eltávolítása nem-paraméteres tesztekhez vezet, amelyek különösen hasznosak kis minták esetén.

A t-próba kidolgozása varianciaanalízishez vezet, amelyet akkor használunk, ha az összehasonlítandó csoportok száma kettőnél több. A nemparaméteres eljárások ennek megfelelő fejlődése nem-parametrikus varianciaanalízishez vezet, bár ez lényegesen gyengébb, mint a klasszikus varianciaanalízis.

A függőség, vagy kissé nagyképűen fogalmazva a kapcsolat szorossági fokának felmérésére a Pearson-korrelációs együtthatót számítjuk ki. Szigorúan véve használatának vannak korlátai, amelyek például az adatmérési skála típusával és a kapcsolat nemlinearitásával járnak együtt, tehát nem paraméteres, vagy úgynevezett rangkorrelációs együtthatókat használnak pl. , a rangsorolt ​​adatokhoz, szintén használhatók alternatívaként. Ha az adatokat névleges skálán mérjük, akkor természetes, hogy azokat kontingenciatáblázatokban mutatjuk be, amelyek a Pearson khi-négyzet tesztet alkalmazzák különféle variációkkal és pontosításokkal.

Tehát lényegében csak néhány fajta kritérium és eljárás létezik, amelyeket tudnia kell és tudnia kell használni, az adatok sajátosságaitól függően. Meg kell határoznia, hogy egy adott helyzetben melyik kritériumot kell alkalmazni.

A nem paraméteres módszerek a legmegfelelőbbek, ha a minta mérete kicsi. Ha sok adat van (például n > 100), akkor gyakran nincs értelme nemparaméteres statisztikákat használni.

Ha a minta mérete nagyon kicsi (például n = 10 vagy kisebb), akkor a normál közelítést használó nemparaméteres tesztek szignifikanciaszintjei csak durva becslésnek tekinthetők.

Különbségek a független csoportok között. Ha van két mintája (például férfiak és nők), amelyeket össze szeretne hasonlítani valamilyen átlagértékkel, például átlagos vérnyomással vagy fehérvérsejtszámmal, akkor használhatja a független minták t tesztjét.

Ennek a tesztnek a nem paraméteres alternatívái a Wald-Wolfowitz, Mann-Whitney sorozat teszt)/n, ahol x i az i-edik érték, n a megfigyelések száma. Ha egy változó negatív értékeket vagy nullát (0) tartalmaz, a geometriai átlag nem számítható ki.

Harmonikus átlag

A harmonikus átlagot néha a frekvenciák átlagolására használják. A harmonikus átlag kiszámítása a következő képlettel történik: GS = n/S(1/x i) ahol GS a harmonikus átlag, n a megfigyelések száma, x i az i megfigyelési szám értéke. Ha egy változó nullát (0) tartalmaz, a harmonikus átlag nem számítható ki.

Variancia és szórás

A minta variancia és a szórása az adatok variabilitásának (variációjának) leggyakrabban használt mértéke. A diszperziót a változó értékeknek a minta átlagától való eltérésének négyzetes összegeként számítják ki, osztva n-1-gyel (de nem n-nel). A szórást a varianciabecslés négyzetgyökeként számítjuk ki.

Hatály

Egy változó tartománya a változékonyság mutatója, a maximum mínusz a minimum alapján számítva.

Kvartilis tartomány

A negyedéves tartomány értelemszerűen a felső kvartilis mínusz az alsó kvartilis (75% percentilis mínusz 25% percentilis). Mivel a 75%-os percentilis (felső kvartilis) az az érték, amelytől balra a megfigyelések 75%-a, a 25%-os percentilis (alsó kvartilis) pedig az az érték, amelytől balra a megfigyelések 25%-a van, a kvartilis tartomány a medián körüli intervallum, amely a megfigyelések (változóértékek) 50%-át tartalmazza.

Aszimmetria

A ferdeség az eloszlás alakjának jellemzője. Az eloszlás balra ferde, ha a ferdeségi érték negatív. Az eloszlás jobbra ferde, ha a ferdeség pozitív. A standard normális eloszlás ferdesége 0. A ferdeség a harmadik momentumhoz kapcsolódik, és a következőképpen definiálható: ferdeség = n × M 3 /[(n-1) × (n-2) × s 3 ], ahol M 3 egyenlő: (x i -xátlag x) 3, s 3 - a harmadik hatványra emelt szórás, n - a megfigyelések száma.

Felesleg

A kurtózis egy eloszlás alakjának jellemzője, nevezetesen a csúcsa élességének mértéke (egy normális eloszláshoz viszonyítva, amelynek a körtózisa 0). Jellemzően a normálnál élesebb csúcsú eloszlások pozitív körtózissal rendelkeznek; Azok az eloszlások, amelyek csúcsa kevésbé éles, mint a normál eloszlás csúcsa, negatív görtózissal rendelkeznek. A kurtózis a negyedik pillanathoz kapcsolódik, és a képlet határozza meg:

kurtosis = /[(n-1) × (n-2) × (n-3) × s 4 ], ahol M j egyenlő: (x-közép x, s 4 - szórás a negyedik hatványig, n - megfigyelések száma.

A gazdasági és társadalmi gyakorlat igényei megkövetelik a folyamatok kvantitatív leírására szolgáló módszerek kidolgozását, amelyek lehetővé teszik nemcsak a mennyiségi, hanem a minőségi tényezők pontos rögzítését is. Feltéve, hogy a minőségi jellemzők értékei a jellemző csökkenésének (növekedésének) mértéke szerint rendezhetők vagy rangsorolhatók, lehetőség nyílik a kapcsolat szorosságának felmérésére. minőségi jelek. Kvalitatív alatt olyan jellemzőt értünk, amely nem mérhető pontosan, de lehetővé teszi az objektumok egymással való összehasonlítását, és ezáltal a minőség csökkenésének vagy növekedésének sorrendbe rendezését. A mérések valós tartalma pedig a rangsorolási skálákban az a sorrend, amelyben a tárgyak a mért jellemző kifejeződési foka szerint vannak elrendezve.

Gyakorlati célokra nagyon hasznos a rangkorreláció használata. Például, ha a termékek két minőségi jellemzője között magas rangú korrelációt állapítunk meg, akkor elegendő a termékeket csak az egyik jellemző alapján irányítani, ami csökkenti a költségeket és felgyorsítja az ellenőrzést.

Példaként tekinthetjük, hogy számos vállalkozás kereskedelmi termékeinek elérhetősége és az értékesítés rezsiköltsége között van összefüggés. 10 megfigyelés során a következő táblázatot kaptuk:

Soroljuk fel az X értékeit növekvő sorrendbe, és minden értékhez hozzárendeljük a sorszámot (rangsort):

Így,

Készítsük el a következő táblázatot, ahol az X és Y párok vannak feljegyezve, a megfigyelés eredményeként kapott rangjaikkal:

A rangkülönbséget így jelölve felírjuk a Spearman-féle korrelációs együttható kiszámításának képletét:

ahol n a megfigyelések száma, ami egyben a rangpárok száma is.

A Spearman együttható a következő tulajdonságokkal rendelkezik:

Ha teljes közvetlen kapcsolat áll fenn az X és Y minőségi jellemzők között abban az értelemben, hogy az objektumok rangsorai az i összes értékére egybeesnek, akkor a Spearman-féle korrelációs együttható 1-gyel egyenlő. kapunk 1.

Ha teljes inverz kapcsolat van az X és Y minőségi jellemzők között abban az értelemben, hogy a rang a rangnak felel meg, akkor a Spearman-féle korrelációs együttható minta -1.

Valóban, ha

Az értéket behelyettesítve a Spearman korrelációs együttható képletébe -1-et kapunk.

Ha nincs sem teljes egyenes, sem teljes visszacsatolás, akkor a minta Spearman-korrelációs együtthatója -1 és 1 között van, és minél közelebb van a 0-hoz, annál kisebb a kapcsolat a jellemzők között.

A fenti példa adatait felhasználva megtaláljuk a P értékét, és kiegészítjük a táblázatot az értékekkel és:

Minta Kendall korrelációs együttható. A Kendall rangkorrelációs együttható segítségével értékelheti két minőségi jellemző közötti kapcsolatot.

Legyen az objektumok rangsora egy n méretű mintában egyenlő:

X jellemző szerint:

Y karakterisztikával: . Tételezzük fel, hogy jobbra vannak nagyok, jobbra nagyok, jobbra nagyok. Vezessük be a rangok összegének jelölését

Hasonlóképpen bevezetjük a jelölést a jobbra fekvő, de kisebb rangok számának összegeként.

A minta Kendall-korrelációs együttható a következőképpen van felírva:

Ahol n a minta mérete.

A Kendall-együttható tulajdonságai megegyeznek a Spearman-együtthatóval:

Ha teljes közvetlen kapcsolat van az X és Y minőségi jellemzők között abban az értelemben, hogy az objektumok rangsorai az i összes értékére egybeesnek, akkor a minta Kendall-korrelációs együttható egyenlő 1-gyel. Valójában jobbra n van -1 rangú, nagy, ezért ugyanúgy megállapítjuk, Mit. Majd. És a Kendall-együttható egyenlő: .

Ha teljes inverz kapcsolat van az X és Y minőségi jellemzők között abban az értelemben, hogy a rang a rangnak felel meg, akkor a minta Kendall-korrelációs együtthatója -1. Nincsenek magasabb rangok a jobb oldalon, ezért. Hasonlóképpen. Az R+=0 értéket behelyettesítve a Kendall-együttható képletbe -1-et kapunk.

Megfelelően nagy mintamérettel és a rangkorrelációs együtthatók értékei nem közelítik meg az 1-et, közelítő egyenlőség áll fenn:

A Kendall-együttható konzervatívabb becslést ad a korrelációra, mint a Spearman-együttható? (számérték? mindig kisebb, mint). Bár az együttható kiszámítása? kevésbé munkaigényes, mint az együttható kiszámítása, az utóbbit könnyebb újraszámítani, ha új tagot adunk a sorozathoz.

Az együttható fontos előnye, hogy segítségével meghatározható a parciális rangkorrelációs együttható, amely lehetővé teszi két rangsorolási jellemző „tiszta” kapcsolatának mértékét, kiküszöbölve a harmadik befolyását:

A rangkorrelációs együtthatók jelentősége. A rangkorreláció erősségének mintaadatokból történő meghatározásakor a következő kérdést kell figyelembe venni: mennyire lehet magabiztosan támaszkodni arra a következtetésre, hogy a sokaságban korreláció áll fenn, ha egy bizonyos minta rangkorrelációs együtthatót kapunk. Más szóval, a megfigyelt rangkorrelációk szignifikanciáját a vizsgált két rangsor statisztikai függetlenségének hipotézise alapján kell tesztelni.

Viszonylag nagy n mintaszám esetén a rangkorrelációs együtthatók szignifikanciájának ellenőrzése elvégezhető a normál eloszlási táblázat segítségével (1. számú melléklet). Hogy teszteljük a Spearman-együttható jelentőségét? (n>20 esetén) számítsa ki az értéket

és a Kendall-együttható jelentőségét tesztelni? (n>10 esetén) számítsa ki az értéket

ahol S=R+- R-, n - mintanagyság.

Ezután beállítják a szignifikancia szintet?, meghatározzák a tcr(?,k) kritikus értéket a Student-eloszlás kritikus pontjainak táblázatából, és összehasonlítják a számított értéket vagy azzal. Feltételezzük, hogy a szabadsági fokok száma k = n-2. Ha vagy > tcr, akkor a vagy értékek szignifikánsnak minősülnek.

Fechner korrelációs együttható.

Végül meg kell említeni a kapcsolat elemi szorossági fokát jellemző Fechner-együtthatót, amellyel csekély mennyiségű kiindulási információ esetén célszerű a kapcsolat meglétét megállapítani. Számításának alapja, hogy figyelembe veszi az egyes variációs sorozatok számtani átlagától való eltérés irányát, és meghatározza ezen eltérések előjeleinek konzisztenciáját a két sorozatra, amelyek közötti összefüggést mérjük.

Ezt az együtthatót a következő képlet határozza meg:

ahol na az egyes értékek számtani átlagától való eltérésére utaló jelek egybeesésének száma; nb - az eltérések száma.

A Fechner-együttható -1,0 belül változhat<= Кф<= +1,0.

A rangkorreláció alkalmazott szempontjai. Mint már említettük, a rangkorrelációs együtthatók nemcsak két rangjellemző közötti kapcsolat kvalitatív elemzésére használhatók, hanem a rang és a mennyiségi jellemzők közötti kapcsolat erősségének meghatározására is. Ebben az esetben a mennyiségi jellemző értékeit rendezzük, és hozzájuk rendeljük a megfelelő rangokat.

Számos olyan helyzet adódhat, amikor két mennyiségi jellemző közötti kapcsolat erősségének meghatározásakor a rangkorrelációs együtthatók számítása is célszerű. Ha tehát az egyik (vagy mindkettő) eloszlása ​​jelentősen eltér a normál eloszlástól, az r mintakorrelációs együttható szignifikanciaszintjének meghatározása hibássá válik, míg rangsorolási együtthatók? És? nem vonatkoznak ilyen korlátozások a jelentőség szintjének meghatározásakor.

Egy másik ilyen helyzet áll elő, amikor két mennyiségi jellemző közötti kapcsolat nemlineáris (de monoton) jellegű. Ha a mintában kevés az objektumok száma, vagy ha a kapcsolat előjele fontos a kutató számára, akkor korrelációs összefüggést kell használni? itt nem megfelelő. A rangkorrelációs együttható kiszámítása lehetővé teszi ezen nehézségek megkerülését.

Gyakorlati rész

1. feladat Korreláció- és regresszióanalízis

A probléma megfogalmazása és formalizálása:

Egy empirikus mintát adunk meg, amelyet a berendezés állapotára (meghibásodásra) és a gyártott termékek számára vonatkozó számos megfigyelés alapján állítunk össze. A minta implicit módon jellemzi a kapcsolatot a meghibásodott berendezések mennyisége és a gyártott termékek száma között. A minta jelentése szerint jól látható, hogy az üzemben maradó berendezéseken gyártott termékek készülnek, hiszen minél nagyobb a meghibásodott berendezések aránya, annál kevesebb a gyártott termék. Szükséges a minta korrelációs-regressziós függésének vizsgálata, azaz a függőség formájának megállapítása, a regressziós függvény értékelése (regresszióanalízis), valamint a valószínűségi változók közötti kapcsolat azonosítása és szorosságának értékelése (korreláció). elemzés). A korrelációelemzés további feladata az egyik változó regressziós egyenletének becslése a másikra. Ezenkívül meg kell jósolni az előállított termékek számát a berendezés 30%-os meghibásodása esetén.

Formalizáljuk az adott mintát a táblázatban, a „Berendezés meghibásodás, %” adatot X-el, a „Termékszám” adatot Y-vel jelölve:

Kezdeti adatok. 1. táblázat

A probléma fizikai jelentéséből kitűnik, hogy az Y gyártott termékek száma közvetlenül függ a berendezés meghibásodásának %-ától, vagyis Y függésben van X-től. A regressziós elemzés során meg kell találni a az X és Y értékeit összekötő matematikai összefüggés (regresszió). Ebben az esetben a regresszióanalízis a korrelációval ellentétben azt feltételezi, hogy az X érték független változóként vagy faktorként, az Y érték mint egy függő változó, vagy effektív attribútum. Így szükséges egy adekvát közgazdasági és matematikai modell szintetizálása, pl. határozzuk meg (keressük meg, válasszuk ki) az X és Y értékei közötti kapcsolatot jellemző Y = f(X) függvényt, amelynek segítségével előre megjósolható lesz Y értéke X = 30-nál. A probléma megoldása korrelációs-regressziós elemzéssel végezhető el.

A korrelációs-regressziós problémák megoldási módszereinek rövid áttekintése és a választott megoldási mód indoklása.

A kapott jellemzőt befolyásoló tényezők száma alapján végzett regresszióelemzési módszereket egy- és többtényezősre osztjuk. Egytényezős - a független tényezők száma = 1, azaz. Y = F(X)

többtényezős - a tényezők száma > 1, azaz.

A vizsgált függő változók (eredményjellemzők) száma alapján a regressziós problémák egy és több eredő jellemzőt tartalmazó problémákra is feloszthatók. Általában sok hatékony jellemzővel rendelkező probléma írható fel:

A korrelációs-regressziós analízis módszere abból áll, hogy megtaláljuk a forma közelítő (közelítő) függésének paramétereit.

Mivel a fenti probléma csak egy független változót érint, azaz csak egy, az eredményt befolyásoló tényezőtől való függést vizsgáljuk, az egytényezős függőség vizsgálatát, vagy páros regressziót kell alkalmazni.

Ha csak egy tényező van, a függőséget a következőképpen határozzuk meg:

Egy adott regressziós egyenlet felírásának formája a faktor és a kapott jellemző közötti statisztikai kapcsolatot megjelenítő függvény megválasztásától függ, és a következőket tartalmazza:

lineáris regresszió, formaegyenlet,

parabola, formaegyenlet

köbös, alakegyenlet

hiperbolikus, a forma egyenlete

féllogaritmikus, a forma egyenlete

exponenciális, a forma egyenlete

forma hatványegyenlete.

A függvény megtalálása a regressziós egyenlet paramétereinek meghatározásán és magának az egyenletnek a megbízhatóságának értékelésén múlik. A paraméterek meghatározásához használhatja a legkisebb négyzetek módszerét és a legkisebb modulus módszerét is.

Ezek közül az első annak biztosítása, hogy az Yi tapasztalati értékeinek négyzetes eltéréseinek összege a számított átlagos Yi-től minimális legyen.

A legkisebb modulus módszere abból áll, hogy minimalizáljuk az Yi tapasztalati értékei és a számított átlagos Yi közötti különbség modulusainak összegét.

A probléma megoldásához a legkisebb négyzetek módszerét választjuk, mivel ez a legegyszerűbb és jó becsléseket ad a statisztikai tulajdonságok szempontjából.

Technológia a regressziós analízis problémájának megoldására a legkisebb négyzetek módszerével.

A változók közötti kapcsolat típusát (lineáris, másodfokú, köbös stb.) úgy határozhatja meg, hogy megbecsüli a tényleges y érték eltérését a számítotttól:

ahol tapasztalati értékek, a közelítő függvény segítségével számított értékek. A különböző függvények Si értékeinek becslésével és közülük a legkisebb kiválasztásával közelítő függvényt választunk.

Egy adott függvény típusát úgy határozzuk meg, hogy megtaláljuk az egyes függvényekre talált együtthatókat egy bizonyos egyenletrendszer megoldásaként:

lineáris regresszió, formaegyenlet, rendszer -

parabola, formaegyenlet, rendszer -

köb, formaegyenlet, rendszer -

A rendszer megoldása után megtaláljuk, aminek segítségével az analitikai függvény egy konkrét kifejezéséhez jutunk, amelynek birtokában megtaláljuk a számított értékeket. Ezután ott van az összes adat az S eltérés nagyságának becsléséhez és a minimum elemzéséhez.

Lineáris összefüggés esetén az X faktor és a kapott Y karakterisztiká közötti kapcsolat szorosságát r korrelációs együttható formájában becsüljük meg:

A mutató átlagos értéke;

Átlagos faktorérték;

y a mutató kísérleti értéke;

x a faktor kísérleti értéke;

Szórás x-ben;

Szórás y-ban.

Ha a korrelációs együttható r = 0, akkor azt tekintjük, hogy a jellemzők közötti kapcsolat jelentéktelen vagy hiányzik, ha r = 1, akkor a jellemzők között nagyon magas a funkcionális kapcsolat.

A Chaddock táblázat segítségével minőségileg értékelheti a jellemzők közötti összefüggés szorosságát:

Chaddock-tábla 2. táblázat.

Nemlineáris függőség esetén meghatározzuk a korrelációs arányt (0 1) és az R korrelációs indexet, amelyeket a következő függőségekből számítunk ki.

ahol az érték a regressziós függésből számított mutató értéke.

A számítások pontosságának értékeléséhez a közelítés átlagos relatív hibájának értékét használjuk

Nagy pontossággal 0-12% tartományban van.

A funkcionális függőség kiválasztásának értékeléséhez a determinációs együtthatót használjuk

A determinációs együtthatót egy funkcionális modell illeszkedési minőségének „általánosított” mérőszámaként használjuk, mivel a faktor és a teljes variancia közötti kapcsolatot, pontosabban a faktorvarianciának az összesben való részesedését fejezi ki.

Az R korrelációs index szignifikanciájának felmérésére Fisher-féle F-tesztet használunk. A kritérium tényleges értékét a következő képlet határozza meg:

ahol m a regressziós egyenlet paramétereinek száma, n a megfigyelések száma. Az értéket összehasonlítjuk a kritikus értékkel, amelyet az F-kritérium táblázatból határozunk meg, figyelembe véve az elfogadott szignifikanciaszintet és a szabadságfokok számát és. Ha, akkor az R korrelációs index értéke szignifikánsnak tekinthető.

A kiválasztott regressziós formához a regressziós egyenlet együtthatóit számítjuk ki. Az egyszerűség kedvéért a számítási eredményeket egy táblázat tartalmazza a következő szerkezettel (általában az oszlopok száma és típusa a regresszió típusától függően változik):

3. táblázat

A probléma megoldása.

Megfigyelések történtek egy gazdasági jelenségről - a termékkibocsátás függését a berendezés meghibásodásának százalékától. Értékkészletet kapunk.

A kiválasztott értékeket az 1. táblázat tartalmazza.

Az adott minta alapján elkészítjük az empirikus függés grafikonját (1. ábra)

A grafikon megjelenése alapján megállapítjuk, hogy az analitikai függés lineáris függvényként ábrázolható:

Számítsuk ki a párkorrelációs együtthatót az X és Y közötti kapcsolat értékeléséhez:

Építsünk egy segédtáblát:

4. táblázat

Megoldjuk az egyenletrendszert, hogy megtaláljuk az együtthatókat, és:

az első egyenletből, helyettesítve az értéket

a második egyenletbe a következőket kapjuk:

találunk

Megkapjuk a regressziós egyenlet alakját:

9. A talált kapcsolat szorosságának értékeléséhez az r korrelációs együtthatót használjuk:

A Chaddock táblázat segítségével megállapítjuk, hogy r = 0,90 esetén az X és Y közötti kapcsolat nagyon magas, ezért a regressziós egyenlet megbízhatósága is magas. A számítások pontosságának értékeléséhez a közelítés átlagos relatív hibájának értékét használjuk:

Úgy gondoljuk, hogy az érték a regressziós egyenlet nagyfokú megbízhatóságát biztosítja.

X és Y közötti lineáris kapcsolat esetén a meghatározási index egyenlő az r korrelációs együttható négyzetével: . Következésképpen a teljes variáció 81%-a az X faktor tulajdonság változásával magyarázható.

Az R korrelációs index szignifikanciájának felmérésére, amely lineáris kapcsolat esetén abszolút értékben egyenlő az r korrelációs együtthatóval, a Fisher F tesztet alkalmazzuk. A tényleges értéket a következő képlet segítségével határozzuk meg:

ahol m a regressziós egyenlet paramétereinek száma, n a megfigyelések száma. Vagyis n = 5, m = 2.

Figyelembe véve az elfogadott =0,05 szignifikancia szintet és a szabadságfokok számát, megkapjuk a kritikus táblázatértéket. Mivel az R korrelációs index értéke szignifikánsnak tekinthető.

Számítsuk ki Y előrejelzett értékét X = 30-nál:

Ábrázoljuk a talált függvényt:

11. Határozza meg a korrelációs együttható hibáját a szórás értékével!

majd meghatározzuk a normalizált eltérés értékét

Egy > 2 arányból 95%-os valószínűséggel beszélhetünk a kapott korrelációs együttható szignifikanciájáról.

2. feladat. Lineáris optimalizálás

1. lehetőség.

A regionális fejlesztési terv 3 olajmező üzembe helyezését tervezi, összesen 9 millió tonna kitermeléssel. Az első mezőn a termelési mennyiség legalább 1 millió tonna, a másodikon - 3 millió tonna, a harmadikon - 5 millió tonna. Az ilyen termelékenység eléréséhez legalább 125 kutat kell fúrni. A terv megvalósítására 25 millió rubelt különítettek el. tőkebefektetések (K mutató) és 80 km vezeték (L mutató).

Meg kell határozni az optimális (maximális) kutak számát az egyes táblák tervezett termőképességének biztosításához. A feladat kiinduló adatait a táblázat tartalmazza.

Kezdeti adatok

A problémafelvetés fentebb található.

Formalizáljuk a feladatban megadott feltételeket, korlátozásokat. Az optimalizálási probléma megoldásának célja az, hogy megtaláljuk maximális érték olajtermelés optimális számú kúttal minden mezőhöz, figyelembe véve a probléma meglévő korlátait.

A célfüggvény a probléma követelményeinek megfelelően a következő formában lesz:

ahol az egyes mezők kutak száma.

Meglévő feladatkorlátozások:

csőfektetési hossz:

kutak száma minden mezőn:

1 kút építésének költsége:

A lineáris optimalizálási problémákat például a következő módszerekkel lehet megoldani:

Grafikusan

Simplex módszer

Használat grafikus módszer csak akkor kényelmes, ha két változós lineáris optimalizálási feladatokat old meg. Nagyobb számú változó esetén algebrai apparátust kell használni. Tekintsünk egy általános módszert a lineáris optimalizálási feladatok megoldására, amelyet szimplex módszernek nevezünk.

A Simplex módszer az iteratív számítások tipikus példája a legtöbb optimalizálási probléma megoldásában. Ilyen iteratív eljárásokat tartunk számon, amelyek operációkutatási modellek segítségével adnak megoldást a problémákra.

Egy optimalizálási feladat szimplex módszerrel történő megoldásához szükséges, hogy az Xi ismeretlenek száma nagyobb legyen, mint az egyenletek száma, azaz. egyenletrendszer

elégedett a kapcsolat m

A= egyenlő volt m-mel.

Jelöljük az A mátrix oszlopát as, a szabad tagok oszlopát pedig as

Az (1) rendszer alapmegoldása egy m ismeretlen halmaz, amely az (1) rendszer megoldása.

A szimplex módszer algoritmusát röviden a következőképpen írjuk le:

Az eredeti megszorítás, típusegyenlőtlenségként írva<= (=>) egyenlőségként fejezhető ki, ha a megszorítás bal oldalához hozzáadjuk a reziduális változót (a bal oldali többletváltozót kivonva).

Például az eredeti kényszer bal oldalára

reziduális változót vezetünk be, aminek következtében az eredeti egyenlőtlenség egyenlőséggé változik

Ha a kezdeti kényszer határozza meg a csövek áramlási sebességét, akkor a változót az erőforrás maradékaként vagy fel nem használt részeként kell értelmezni.

Egy célfüggvény maximalizálása egyenértékű ugyanazon függvény ellentétes előjellel történő minimalizálásával. Vagyis a mi esetünkben

egyenértékű

A következő formájú alapmegoldáshoz egy szimplex táblázatot állítunk össze:

Ez a táblázat azt jelzi, hogy a probléma megoldása után ezek a cellák tartalmazzák az alapmegoldást. - egy oszlopnak az egyik oszloppal való elosztásából származó hányadosok; - további szorzók a felbontás oszlopához kapcsolódó táblázatcellákban lévő értékek visszaállításához. - a célfüggvény minimális értéke -Z, - az együtthatók értékei a célfüggvényben ismeretlenekre.

Bármilyen pozitív érték megtalálható az értékek között. Ha nem ez a helyzet, akkor a probléma megoldottnak tekintendő. Válassza ki a táblázat bármely oszlopát, amely tartalmazza ezt az oszlopot „megengedő” oszlopnak. Ha a felbontás oszlop elemei között nincs pozitív szám, akkor a probléma megoldhatatlan a célfüggvény korlátlansága miatt a megoldásai halmazán. Ha pozitív számok vannak a felbontás oszlopban, folytassa az 5. lépéssel.

Az oszlop törtekkel van kitöltve, amelyek számlálója az oszlop elemei, nevezője pedig a feloldó oszlop megfelelő elemei. Az összes érték közül a legkisebb van kiválasztva. A legkisebbet produkáló vonalat „feloldó” vonalnak nevezzük. A feloldó sor és a feloldó oszlop metszéspontjában található egy feloldó elem, amelyet valamilyen módon, például színnel kiemelünk.

Az első szimplex tábla alapján összeáll a következő, amelyben:

Egy sorvektort lecserél egy oszlopvektorra

az engedélyező karakterláncot ugyanazzal a karakterlánccal helyettesítjük, osztva az engedélyező elemmel

a táblázat minden fennmaradó sorát ennek a sornak az összegével helyettesítjük a feloldó sorral, megszorozva egy speciálisan kiválasztott járulékos tényezővel, hogy a feloldó oszlop cellájában 0 legyen.

Az új táblázattal a 4. pontra hivatkozunk.

A probléma megoldása.

A probléma megfogalmazása alapján a következő egyenlőtlenségi rendszert kapjuk:

és célfüggvény

Alakítsuk át az egyenlőtlenségrendszert egyenletrendszerré további változók bevezetésével:

Csökkentsük a célfüggvényt megfelelőjére:

Készítsük el a kezdeti szimplex táblát:

Válasszuk ki a felbontás oszlopot. Számítsuk ki az oszlopot:

Az értékeket beírjuk a táblázatba. Ezek közül a legkisebb = 10 felhasználásával meghatározzuk a felbontási karakterláncot: . A feloldó sor és a feloldó oszlop metszéspontjában találjuk a feloldó elemet = 1. A táblázat egy részét feltöltjük további tényezőkkel, így: a táblázat többi soraihoz hozzáadott feloldó sor ezekkel szorozva, 0s a feloldó oszlop elemeiben.

Hozzuk létre a második szimplex táblát:

Ebben vesszük a felbontás oszlopot, kiszámítjuk az értékeket, és beírjuk a táblázatba. Minimum a felbontási sort kapjuk. A feloldó elem 1 lesz. További tényezőket keresünk, és kitöltjük az oszlopokat.

A következő szimplex táblázatot készítjük:

Hasonló módon megtaláljuk a feloldó oszlopot, a feloldó sort és a feloldó elemet = 2. Összeállítjuk a következő szimplex táblát:

Mivel a -Z sorban nincsenek pozitív értékek, ez a táblázat véges. Az első oszlop az ismeretlenek kívánt értékeit adja meg, pl. optimális alapmegoldás:

Ebben az esetben a célfüggvény értéke -Z = -8000, ami Zmax = 8000-nek felel meg. A probléma megoldva.

3. feladat Klaszterelemzés

Probléma kijelentés:

Objektumok felosztása a táblázatban megadott adatok alapján. Válasszon ki egy megoldási módszert, és készítsen adatfüggőségi grafikont.

1. lehetőség.

Kezdeti adatok

Az ilyen típusú problémák megoldására szolgáló módszerek áttekintése. A megoldási mód indoklása.

A klaszterelemzési problémákat a következő módszerekkel lehet megoldani:

Az unió vagy fa klaszterezési módszert "különbözőség" vagy "objektumok közötti távolság" klaszterek kialakítására használják. Ezek a távolságok meghatározhatók egydimenziós vagy többdimenziós térben.

A kétirányú összekapcsolást (viszonylag ritkán) olyan körülmények között alkalmazzák, amikor az adatokat nem "objektumok" és "objektumtulajdonságok", hanem megfigyelések és változók szerint értelmezik. Mind a megfigyelések, mind a változók várhatóan egyszerre járulnak hozzá az értelmes klaszterek felfedezéséhez.

K-módszer. Akkor használatos, ha már létezik hipotézis a klaszterek számával kapcsolatban. Megadhatja a rendszernek, hogy pontosan alkosson például három klasztert, hogy azok a lehető legkülönbözőbbek legyenek. IN általános eset A K-közép módszer pontosan K különböző klasztert hoz létre, amelyek egymástól a lehető legnagyobb távolságra helyezkednek el.

A távolságok mérésére a következő módszerek állnak rendelkezésre:

Euklideszi távolság. Ez a távolság legelterjedtebb típusa. Ez egyszerűen egy geometriai távolság többdimenziós térben, és a következőképpen számítható ki:

Ne feledje, hogy az euklideszi távolságot (és négyzetét) az eredeti adatokból számítják ki, nem a szabványosított adatokból.

Várostömb távolság (Manhattan távolság). Ez a távolság egyszerűen a koordináták közötti különbségek átlaga. A legtöbb esetben ez a távolságmérés ugyanazt az eredményt adja, mint a közönséges euklideszi távolság. Megjegyezzük azonban, hogy ennél a mértéknél az egyes nagy eltérések (outlierek) befolyása csökken (mivel nem négyzetesek). A Manhattan távolságot a következő képlettel számítják ki:

Csebisev távolság. Ez a távolság akkor lehet hasznos, ha két objektumot „különbözőként” akarunk definiálni, ha azok bármely koordinátában (bármelyik dimenzióban) különböznek. A Csebisev távolságot a következő képlettel számítják ki:

Teljesítmény távolság. Néha az ember fokozatosan növeli vagy csökkenti a súlyokat egy olyan dimenzióhoz, amelyhez a megfelelő objektumok nagyon eltérőek. Ez a hatványtörvény távolság használatával érhető el. A teljesítménytávolságot a következő képlet segítségével számítjuk ki:

ahol r és p a felhasználó által meghatározott paraméterek. Néhány példaszámítás megmutathatja, hogyan „működik” ez a mérték. A p paraméter az egyes koordináták mentén fellépő különbségek fokozatos súlyozásáért, az r paraméter az objektumok közötti nagy távolságok progresszív súlyozásáért felelős. Ha az r és a p paraméter kettővel egyenlő, akkor ez a távolság egybeesik az euklideszi távolsággal.

A nézeteltérések százalékos aránya. Ezt a mértéket akkor használjuk, ha az adatok kategorikusak. Ezt a távolságot a következő képlettel számítjuk ki:

A probléma megoldásához a probléma feltételeinek és megfogalmazásának (objektumok felosztása) leginkább megfelelő egységesítési módszert (fa klaszterezés) választjuk. A csatlakozási módszer viszont többféle kommunikációs szabályt használhat:

Egyetlen link (legközelebbi szomszéd módszer). Ebben a módszerben a két klaszter közötti távolságot a különböző klaszterekben lévő két legközelebbi objektum (legközelebbi szomszéd) távolsága határozza meg. Vagyis két klaszterben lévő bármely két objektum közelebb van egymáshoz, mint a megfelelő kommunikációs távolság. Ennek a szabálynak bizonyos értelemben össze kell fűznie az objektumokat, hogy klasztereket képezzenek, és a kapott klasztereket általában hosszú "láncok" képviselik.

Teljes link (a legtávolabbi szomszédok módszere). Ebben a módszerben a klaszterek közötti távolságokat a különböző klaszterekben (vagyis a "legtávolabbi szomszédok") lévő bármely két objektum közötti legnagyobb távolság határozza meg.

Sok más, ehhez hasonló fürtcsatlakozási módszer is létezik (pl. súlyozatlan páronkénti összekapcsolás, súlyozott páronkénti összekapcsolás stb.).

Megoldásmódszer technológia. Mutatók számítása.

Az első lépésben, amikor minden objektum külön klaszter, az objektumok közötti távolságot a kiválasztott mérték határozza meg.

Mivel a probléma nem határozza meg a jellemzők mértékegységeit, feltételezzük, hogy ezek egybeesnek. Következésképpen nincs szükség a forrásadatok normalizálására, ezért azonnal folytatjuk a távolságmátrix kiszámítását.

A probléma megoldása.

A kiindulási adatok alapján készítsünk függőségi gráfot (2. ábra)

Az objektumok közötti távolságnak a szokásos euklideszi távolságot vesszük. Akkor a képlet szerint:

ahol l jelek; k a jellemzők száma, az 1 és 2 objektumok közötti távolság egyenlő:

Folytatjuk a fennmaradó távolságok kiszámítását:

A kapott értékekből készítsünk táblázatot:

Legrövidebb távolság. Ez azt jelenti, hogy a 3, 6 és 5 elemeket egy klaszterbe egyesítjük. A következő táblázatot kapjuk:

Legrövidebb távolság. A 3, 6, 5 és 4 elemeket egy klaszterbe egyesítjük. Két klaszterből álló táblázatot kapunk:

A 3. és 6. elemek közötti minimális távolság egyenlő. Ez azt jelenti, hogy a 3. és 6. elem egy klaszterben van egyesítve. Kiválasztjuk a maximális távolságot az újonnan kialakított klaszter és a fennmaradó elemek között. Például az 1. fürt és a 3.6 fürt közötti távolság max(13.34166, 13.60147)= 13.34166. Készítsük el a következő táblázatot:

Ebben a minimális távolság az 1-es és 2-es klaszterek közötti távolság. Az 1-es és a 2-es klaszterek egy klaszterbe való összevonásával kapjuk:

Így a „távoli szomszéd” módszerrel két klasztert kaptunk: 1,2 és 3,4,5,6, amelyek közötti távolság 13,60147.

A probléma megoldódott.

Alkalmazások. Problémamegoldás alkalmazáscsomagokkal (MS Excel 7.0)

A korreláció- és regresszióanalízis feladata.

A kiindulási adatokat beírjuk a táblázatba (1. ábra)

Válassza a „Szolgáltatás / Adatelemzés” menüt. A megjelenő ablakban válassza ki a „Regression” sort (2. ábra).

Állítsuk be a következő ablakban a beviteli intervallumokat X-ben és Y-ben, hagyjuk a megbízhatósági szintet 95%-on, és a kimeneti adatokat helyezzük el egy külön lapra „Jelentéslap” (3. ábra)

A számítás után a „Jelentőlap” lapon megkapjuk a végső regresszióelemzési adatokat:

Itt is megjelenik a közelítő függvény vagy a „Fit Graph” szóródiagramja:


A kiszámított értékek és eltérések a táblázatban jelennek meg a „Predicted Y” és a „Residuals” oszlopban.

A kezdeti adatok és eltérések alapján egy maradék gráfot készítünk:

Optimalizálási probléma


A kezdeti adatokat a következőképpen írjuk be:

A C9, D9, E9 cellákba írjuk be a szükséges X1, X2, X3 ismeretleneket.

Az X1, X2, X3 célfüggvény együtthatói rendre C7, D7, E7-be kerülnek.

A célfüggvényt a B11 cellába a következő képlet szerint írjuk be: =C7*C9+D7*D9+E7*E9.

Meglévő feladatkorlátok

A csőfektetési hosszhoz:

írja be a C5, D5, E5, F5, G5 cellákba

A kutak száma minden mezőben:

X3 Ј 100; belép a C8, D8, E8 cellákba.

1 db kút építésének költsége:

írja be a C6, D6, E6, F6, G6 cellákba.

A C5*C9+D5*D9+E5*E9 teljes hossz kiszámítására szolgáló képlet a B5 cellába, a C6*C9+D6*D9+E6*E9 teljes költség számítási képlete a B6 cellába kerül.


A menüben válassza ki a „Szolgáltatás/Megoldás keresése” menüpontot, adja meg a megoldás kereséséhez szükséges paramétereket a megadott kezdő adatoknak megfelelően (4. ábra):

A „Paraméterek” gombbal állítsa be a következő paramétereket a megoldás kereséséhez (5. ábra):


A megoldás keresése után jelentést kapunk az eredményekről:

Microsoft Excel 8.0e eredményjelentés

Jelentés készült: 2002.11.17. 1:28:30

Célcella (maximum)

Eredmény

Teljes termelés

Cserélhető cellák

Eredmény

A kutak száma

A kutak száma

A kutak száma

Korlátozások

Jelentése

Hossz

Összefüggő

Projekt költsége

nincs csatlakoztatva.

A kutak száma

nincs csatlakoztatva.

A kutak száma

Összefüggő

A kutak száma

Összefüggő

Az első táblázat annak a célcellának a kezdeti és végső (optimális) értékét mutatja, amelybe a megoldandó probléma célfüggvénye került. A második táblázatban az optimalizált változók kezdeti és végső értékeit látjuk, amelyeket a változtatható cellák tartalmaznak. Az eredményjelentés harmadik táblázata információkat tartalmaz a korlátozásokról. Az „Érték” oszlop a szükséges erőforrások és az optimalizált változók optimális értékeit tartalmazza. A „Képlet” oszlop korlátozásokat tartalmaz az elhasznált erőforrásokra és az optimalizált változókra vonatkozóan, az ezeket az adatokat tartalmazó cellákra mutató hivatkozások formájában. Az „Állapot” oszlop határozza meg, hogy bizonyos korlátozások kötöttek-e vagy nem. Itt a „kötött” megszorítások az optimális megoldásban szigorú egyenlőségek formájában megvalósított korlátozások. Az erőforrás-korlátozások "Különbség" oszlopa határozza meg a felhasznált erőforrások egyenlegét, pl. a szükséges forrásmennyiség és elérhetőségük közötti különbség.

Hasonlóképpen, ha a megoldáskeresés eredményét rögzítjük a „Stabilitási jelentés” űrlapon, a következő táblázatokat kapjuk:

Microsoft Excel 8.0e Fenntarthatósági jelentés

Munkalap: [Az optimalizálási feladat megoldása.xls]A termelésoptimalizálási feladat megoldása

Jelentés készült: 2002.11.17. 1:35:16

Cserélhető cellák

Elfogadható

Elfogadható

jelentése

ár

Együttható

Növekedés

Csökkenés

A kutak száma

A kutak száma

A kutak száma

Korlátozások

Korlátozás

Elfogadható

Elfogadható

jelentése

Jobb oldalt

Növekedés

Csökkenés

Hossz

Projekt költsége

A fenntarthatósági jelentés információkat tartalmaz a változó (optimalizált) változókról és a modell korlátairól. A megadott információk a lineáris feladatok optimalizálása során alkalmazott szimplex módszerre vonatkoznak, a feladat megoldásának fentebb leírt részében. Lehetővé teszi annak értékelését, hogy a kapott optimális megoldás mennyire érzékeny a modell paramétereinek esetleges változásaira.

A jelentés első része a változtatható cellákról tartalmaz információkat, amelyek a mezőkben lévő kutak számának értékét tartalmazzák. A „Resulting Value” oszlop az optimalizált változók optimális értékeit mutatja. A „Célegyüttható” oszlop tartalmazza a célfüggvény együtthatóértékeinek kezdeti adatait. A következő két oszlop azt szemlélteti, hogyan lehet ezeket a tényezőket növelni és csökkenteni a talált optimális megoldás megváltoztatása nélkül.

A fenntarthatósági jelentés második része az optimalizált változókra vonatkozó korlátozásokról tartalmaz információkat. Az első oszlop az optimális megoldás erőforrásigényét jelzi. A második a felhasznált erőforrástípusok árnyékárait tartalmazza. Az utolsó két oszlop a rendelkezésre álló erőforrások mennyiségének esetleges növekedésére vagy csökkentésére vonatkozó adatokat tartalmaz.

Klaszterezési probléma.

A probléma megoldásának lépésről lépésre bemutatott módszere fent található. Az alábbi Excel táblázatok szemléltetik a probléma megoldásának előrehaladását:

"legközelebbi szomszéd módszer"

A klaszteranalízis feladatának megoldása - "KÖZELÉBI SZOMSZÉD MÓDSZER"

Kezdeti adatok

ahol x1 a kimenet térfogata;

x2 - a tárgyi eszközök átlagos éves költsége

Ipari termelési eszközök

"messzi szomszéd módszer"

A klaszteranalízis problémájának megoldása - "TÁVOLI SZOMSZÉD MÓDSZER"

Kezdeti adatok

ahol x1 a kimenet térfogata;

x2 - a tárgyi eszközök átlagos éves költsége

Ipari termelési eszközök

Rangkorrelációs együttható jellemzi a nemlineáris kapcsolat általános természetét: az eredő attribútum növekedése vagy csökkenése a faktoriális növekedésével. Ez a monoton nemlineáris kapcsolat szorosságának mutatója.

A szolgáltatás célja. Ezzel az online számológéppel számolhat Kendal rang korrelációs együttható minden alapképlet szerint, valamint jelentőségének értékelése.

Utasítás. Adja meg az adatok mennyiségét (sorok számát). Az így kapott megoldás egy Word fájlba kerül mentésre.

A Kendal által javasolt együttható a „több-kevesebb” típusú kapcsolatokon alapul, amelyek érvényességét a skálák felépítése során állapították meg.
Válasszunk ki néhány tárgyat, és hasonlítsuk össze a sorrendjüket egy-egy jellemző szerint. Ha egy adott karakterisztika rangsorai közvetlen sorrendet alkotnak (azaz a természetes sorozat sorrendjét), akkor a párhoz +1, ha fordítva, akkor –1-et rendelünk. Egy kiválasztott pár esetén a megfelelő plusz és mínusz mértékegységek (X attribútum és Y attribútum alapján) megszorozódnak. Az eredmény nyilvánvalóan +1; ha mindkét jellemző párjának rangjai ugyanabban a sorrendben helyezkednek el, és –1, ha ellenkező sorrendben.
Ha mindkét jellemző rangsorrendje minden párnál azonos, akkor az összes objektumpárhoz rendelt egységek összege maximális és egyenlő a párok számával. Ha az összes pár rangsorrendje megfordul, akkor –C 2 N . Általános esetben C 2 N = P + Q, ahol P a pozitív, Q pedig a negatív egységek száma, amelyek a párokhoz vannak rendelve, ha összehasonlítjuk a rangsorukat mindkét kritérium alapján.
Az értéket Kendall-együtthatónak nevezzük.
A képletből világosan látszik, hogy a τ együttható azon objektumpárok aránya közötti különbséget jelenti, amelyeknek a sorrendje mindkét alapon azonos (az összes pár számához viszonyítva), valamint azon tárgypárok aránya között, amelyeknek a sorrendje nem esik egybe.
Például a 0,60-as együttható érték azt jelenti, hogy a párok 80%-a azonos sorrendű objektumokkal rendelkezik, 20%-a pedig nem (80% + 20% = 100%; 0,80 – 0,20 = 0,60). Azok. A τ úgy értelmezhető, mint egy véletlenszerűen kiválasztott objektumpár esetén a két jellemző sorrendjének egyezési és nem illeszkedési valószínűségének különbsége.
Általános esetben a τ (pontosabban P vagy Q) kiszámítása még 10-es nagyságrendű N-re is nehézkesnek bizonyul.
Megmutatjuk, hogyan lehet egyszerűsíteni a számításokat.


Példa. Az Orosz Föderáció egyik szövetségi körzetének 10 régiójában 2003-ban az ipari termelés volumene és az állótőkébe történő beruházás közötti kapcsolatot a következő adatok jellemzik:


Számítsa ki a Spearman és Kendal rangkorrelációs együtthatókat! Ellenőrizze szignifikanciájukat α=0,05-nél. Fogalmazzon meg következtetést az ipari termelés volumene és az állótőke-befektetés közötti kapcsolatról az Orosz Föderáció vizsgált régióiban.

Megoldás. Rendeljünk rangokat Y jellemzőhöz és X tényezőhöz.


Az adatokat X szerint rendezzük.
A 3-tól jobbra lévő Y sorban 7 3-nál nagyobb rang található, ezért a 3 a 7-es tagot fogja generálni P-ben.
1-től jobbra 8 1-nél nagyobb rang van (ezek 2, 4, 6, 9, 5, 10, 7, 8), azaz. P tartalmazni fogja a 8-at stb. Ennek eredményeként P = 37, és a képletekkel a következőt kapjuk:

XYrang X, d xY, d yPK
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Egyszerűsített képletek használata:




ahol n a minta mérete; z kp a kétoldali kritikus tartomány kritikus pontja, amelyet a Laplace-függvény táblázatából a Ф(z kp)=(1-α)/2 egyenlőséggel találunk meg.
Ha |τ|< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - a nullhipotézist elvetik. A minőségi jellemzők között jelentős rangkorreláció van.
Keressük meg a z kp kritikus pontot
Ф(z kp) = (1-α)/2 = (1-0,05)/2 = 0,475

Keressük meg a kritikus pontot:

Mivel τ > T kp - elvetjük a nullhipotézist; a két teszt pontszámai közötti rangkorreláció szignifikáns.

Példa. Az önerőből végzett építési-szerelési munkák volumenére és a 10 fős létszámra vonatkozó adatok szerint építőipari cégek Az Orosz Föderáció egyik városa határozza meg e jellemzők közötti kapcsolatot a Kendel-együttható segítségével.

Megoldás számológép segítségével találja meg.
Rendeljünk rangokat Y jellemzőhöz és X tényezőhöz.
Rendezzük el az objektumokat úgy, hogy X-beli soraik a természetes sorozatot képviseljék. Mivel ennek a sorozatnak az egyes párjaihoz rendelt becslések pozitívak, a P-ben szereplő „+1” értékeket csak azok a párok generálják, amelyek Y-beli sorai közvetlen sorrendet alkotnak.
Könnyen kiszámíthatók, ha az Y sorban lévő objektumok rangsorát egymás után összehasonlítjuk az acél objektumokkal.
Kendal együttható.

Általános esetben a τ (pontosabban P vagy Q) kiszámítása még 10-es nagyságrendű N-re is nehézkesnek bizonyul. Megmutatjuk, hogyan lehet egyszerűsíteni a számításokat.

vagy

Megoldás.
Az adatokat X szerint rendezzük.
A 2-től jobbra lévő Y sorban 8 2-nél nagyobb rang található, ezért a 2 a 8-as tagot fogja generálni P-ben.
A 4-től jobbra 6-os rang nagyobb, mint 4 (ezek a 7, 5, 6, 8, 9, 10), azaz. P-ben lesz 6 stb. Ennek eredményeként P = 29, és a képletekkel a következőt kapjuk:

XYrang X, d xY, d yPK
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Egyszerűsített képletek használata:


Annak a nullhipotézisnek az α szignifikanciaszinten történő teszteléséhez, hogy az általános Kendall-rangkorrelációs együttható nullával egyenlő a versengő H 1: τ ≠ 0 hipotézis mellett, ki kell számítani a kritikus pontot:

ahol n a minta mérete; z kp a kétoldali kritikus tartomány kritikus pontja, amelyet a Laplace-függvény táblázatából a Ф(z kp)=(1 - α)/2 egyenlőséggel találunk meg.
Ha |τ| T kp - a nullhipotézist elvetik. A minőségi jellemzők között jelentős rangkorreláció van.
Keressük meg a z kp kritikus pontot
Ф(z kp) = (1 - α)/2 = (1 - 0,05)/2 = 0,475
A Laplace-táblázat segítségével z kp = 1,96-ot kapunk
Keressük meg a kritikus pontot:

Mivel τ

Kapcsolódó kiadványok