• Nem Talált Eredményt

A rezultáns és a diszkrimináns

In document Bevezetés az algebrába (Pldal 94-99)

Noha hasznos ismereteket tartalmaz, ez a szakasz kitérő azon az úton, amit ebben a könyvben be szeretnénk járni, nevezetesen, hogy eljussunk az absztrakt algebrai fogalmak mély megértéséhez. Az Olvasónak azt javasoljuk, hogy ismételje át a determinánsok alaptulajdonságait, például Freud Róbert [2] könyve, és a függelékben található lineáris algebrai összefoglaló alapján.

A 3.2.15. Állítás szerint az f és g polinomok közös gyökeit úgy kereshetjük meg, hogy meghatározzuk a kitüntetett közös osztójukat. Képzeljük el azonban, hogy f és g együtthatói egy t paramétertől függenek, és azt szeretnénk tudni, hogy milyen t értékek azok, amelyekre f-nek és g-nek van közös gyöke. Az euklideszi algoritmust ezzel az általános paraméterrel végigszámolni reménytelennek tűnik. Jó lenne, ha föl tudnánk írni a végeredményt zárt alakban, vagyis egy képletet f és g együtthatói segítségével, amely akkor nulla, ha f-nek és g-nek van közös gyöke. Ez lesz az f és grezultánsa, ami arra is alkalmas, hogy többismeretlenes egyenletrendszereket egyismeretlenesre vezessünk vissza.

3.7.1. Definíció. Legyen T test, és f,g T[x], mégpedig

Az f és grezultánsa az az R(f,g)-vel jelölt (m+n)× (m+n)-es determináns, amit a következőképpen készítünk el.

Az első sorba az an,an-1,..., a0 együtthatókat írjuk, majd csupa nullákat. A második sor első eleme nulla, ezután jönnek sorban an,an-1,..., a0, majd ismét csupa nulla. A harmadik sor elején már két nulla van. Ezt a lépcsőt összesen m soron át folytatjuk, ekkor az m-edik sorban a0 lesz a legutolsó elem. Ezután ugyanezt az eljárást a maradék n sorban elvégezzük a bm,bm-1,...,b0 együtthatókkal is.

Példaként lássuk ezt a determinánst, amikor n=4 és m=3:

Annak magyarázata, hogy hogyan jut eszünkbe pont ezt a determinánst fölírni, megtalálható Fried Ervin [19]

könyvében (II. rész, 9.3. fejezet).

Fontos megjegyeznünk, hogy a rezultáns definíciójában megengedtük azt az esetet is, hogy an (vagy bm) nulla legyen. A rezultáns tehát nemcsak az f és g polinomoktól függ, hanem az n és m számoktól is, azaz attól, hogy hány nulla együtthatót írunk ki a polinom „tetejére”. Emiatt a rezultáns an=bm=0 esetén is nulla lesz, nemcsak akkor, amikor a két polinomnak van közös gyöke. Az Olvasó joggal kérdezheti: mi értelme van annak, hogy

„felesleges” nulla együtthatókat írjunk a determinánsba?

A válasz a következő: elképzelhető, hogy az an és bm együtthatókról nem tudjuk, hogy nullával egyenlőek-e! Ha mondjuk an egy t paramétertől függő kifejezés, akkor kényelmetlen (sőt néha kivitelezhetetlen) lenne előbb megvizsgálni, hogy mely t értékekre lesz ez nulla, és attól függően más és más rezultánst fölírni. Sokkal egyszerűbb ezt a determinánst csak egyszer kiszámítani. Erre a jelenségre példát fogunk mutatni, amikor a rezultánst egy egyenletrendszer megoldására alkalmazzuk.

A rezultáns fő tulajdonságát a 3.7.3. Tételben mondjuk ki. A több lehetséges bizonyítás közül azt mutatjuk be, amely nagyon tanulságos absztrakt algebrai szempontból is.

3.7.2. Állítás. Legyenek f(x)=anxn+...+a0 és g(x)=bmxm+...+b0 a T test fölötti polinomok. Tegyük föl, hogy an≠ 0 (azaz f≠ 0 és foka n), továbbá, hogy f gyöktényezőkre bomlik T fölött, és gyökei α1,...,αn T (mindegyiket annyiszor felsorolva, amennyi a multiplicitása). Ekkor

Mint láttuk, a rezultáns fölírásakor nemcsak az f és g polinomokat, hanem az n és m számokat is meg kell adni.

A fenti állítást úgy értjük, hogy a rezultánsban szereplő n és m ugyanaz, mint az állításban szereplő n és m. Az állítás tehát nem marad igaz, ha az f polinom „tetejére” nulla együtthatókat írunk (és ennek megfelelően növeljük a determinánst). Ugyanezt a g-vel azonban büntetlenül megtehetjük, vagyis bm=0 is megengedett.

Bizonyítás. A feltétel szerint

A számolást célszerű úgy elvégezni (a bizonyítás során meglátjuk majd, miért), hogy az αi, bj, an konkrét T-beli elemek helyett határozatlanokkal számolunk. Ezért tekintsük az R=T[u,v0,...,vm, x1,..., xn, y1, ..., ym] polinomgyűrűt, és R[x]-ben az

valamint a

polinomokat. Ha belátjuk, hogy R(F,G)=um G(x1)... G(xn), akkor innen az xi αi, vj bj, u↦ an helyettesítéssel az állítást kapjuk. Az y1,..., ym a számolás során használt segédváltozók lesznek.

Az R(F,G) rezultáns definíciójában szerepelő determinánst szorozzuk meg jobbról a V(y1,...,ym, x1,..., xn) Vandermonde-determinánssal (lásd D.5.3). A fenti n=4 és m=3 esetben tehát a következő determinánsról van szó:

A determinánsok szorzástételét (D.5.1. Tétel) alkalmazzuk, és ezért számítsuk ki a két mátrix szorzatát.

Eredményként egy olyan mátrixot kapunk, amely négy részmátrixból tehető össze. A bal felső sarokban egy m×

m-es M mátrix áll, amelyben az i-edik sor j-edik eleme F(yj)yjm-i. Mellette jobbra egy m× n-es részmátrix áll, melynek elemei F(xj)xjm-i. Ezek az elemek nullával egyenlőek, hiszen F(xj)=0 az F definíciója miatt. A bal alsó sarokban egy n× m-es részmátrix áll, melynek elemei G(yj)yjn-i. Végül a jobb alsó sarokban álló n× n-es N részmátrix elemei G(xj)xjn-i. Az n=4 és m=3 esetben tehát a következő determinánst kapjuk:

Mivel a jobb felső sarokban álló részmátrix mindegyik eleme nulla, ez a determináns az M és N részmátrixok determinánsainak a szorzata lesz (lásd D.5.2). Az M részmátrix oszlopaiból F(yj)-t kiemelve a V(y1,...,ym) Vandermonde-determináns marad. Hasonlóan N oszlopaiból G(xj)-t kiemelve V(x1,...,xn) marad. Mindezt összevetve

Itt F(yi)=u(yi-x1)... (yi-xn). A Vandermonde-determinánsok kifejtését beírva, és az yi-xj, xi-xj, yi-yj nem nulla polinomokkal egyszerűsítve pontosan a bizonyítandó összefüggést kapjuk. Ez az egyszerűsítés megengedett, mert az R nullosztómentes (hiszen test fölötti polinomgyűrű). □

Most már világos, hogy miért kellett az αi helyett határozatlanokkal számolni. Az ugyanis véletlenül megeshet, hogy f-nek van többszörös gyöke, és akkor αij nulla is lehet, amivel a fenti bizonyításban nem tudnánk egyszerűsíteni. A megfelelő xi-xj polinom azonban nem a nulla polinom. A vele való egyszerűsítés ezért megengedett, és két egyenlő polinomot kapunk az egyszerűsítés után is. Ide helyettesítünk azután az xi helyébe αi-t. (Érdemes elolvasni a 2.5.15. Feladat (4)-es pontjának megoldását követő megjegyzéseket is.)

Megjegyzés

Ha az Olvasó végignézi az iménti bizonyítást, akkor arra a látszólagos következtetésre juthat, hogy a bizonyításban az an≠ 0 feltételt sehol sem használtuk föl. Ez nincs így, a feltételt még a legelején, ott használtuk ki, hogy f-et f(x)=an(x-α1)... (x-αn) alakban írtuk föl.

Ha an=0, akkor f-nek kevesebb, mint n gyöke van. Ha ezeket α1,...,αk jelöli, akkor a módosított R(f,g)=anm g(α1)... g(αk) képlet sem marad érvényben. Valóban, legyen f(x)=0x2+x-1 és g(x)=x+1. E két polinom rezultánsa nem nulla. Ugyanakkor f egyetlen gyöke az α1=1, továbbá n=2, m=1, an=0, és a 01g(1) képlet nullát ad eredményül.

3.7.3. Tétel. Legyenek f(x)=anxn+... +a0, valamint g(x)=bmxm+... +b0 egy T test fölötti polinomok, melyek T fölött gyöktényezőkre bomlanak.

1. Ha f(x)=an(x-α1)... (x-αn) és g(x)=bm(x-β1)... (x-βn), ahol αi, βj a T test elemei, és an és bm egyike sem nulla, akkor

2. Az R(f,g) akkor és csak akkor nulla, ha vagy an=bm=0, vagy a két polinomnak van közös gyöke T-ben.

Bizonyítás. Az (1) állítás első egyenlőségét már beláttuk az előző állításban. A második egyenlőség ebből azonnal látszik, ha g gyöktényezős alakjába behelyettesítünk. Ha mindegyik αij szorzatot megfordítjuk, akkor összesen mn-szer váltottunk előjelet. Az f gyöktényezős alakjából tehát a harmadik egyenlőséget is megkapjuk.

Innen az utolsó egyenlőség ismét az előző állításból következik, f és g szerepének megcserélésével.

Bizonyítsuk be most a (2) állítást. Három esetet különböztetünk meg.

Ha an=bm=0, akkor a rezultáns definíciójában a determináns első oszlopa nulla, és így a rezultáns is nulla.

Ilyenkor tehát (2) igaz.

Ha an≠ 0, akkor alkalmazhatjuk a 3.7.2. Állítást, ami szerint

Mivel an≠ 0, az R(f,g) pontosan akkor lesz nulla, ha valamelyik αi gyöke g-nek, tehát ha van közös gyök. Vagyis (2) ismét igaz.

Végül tegyük föl, hogy bm≠ 0. Az f és g szerepének fölcserélésével kapjuk, hogy R(g,f) akkor és csak akkor nulla, ha a két polinomnak van közös gyöke. Vegyük észre azonban, hogy az R(f,g)=(-1)nmR(g,f) egyenlőség közvetlenül is világos, hiszen a determináns két sor cseréjekor előjelet vált. Ezért R(f,g) és R(g,f) ugyanakkor lesz nulla, és így (2) most is teljesül. □

A most bizonyított tétel akkor izgalmas, ha az f és g polinomoknak nem ismerjük a gyökeit. De mi a helyzet akkor, ha például racionális együtthatós polinomokról van szó, amelyeknek nincsen racionális gyöke? Mit mond róluk az, hogy a rezultánsuk nulla? Ebben az esetben a tételt a komplex számtestben érdemes alkalmazni (mert ott minden polinom gyöktényezős alakra bomlik), és azt kapjuk, hogy a két polinomnak van közös komplex gyöke. Nemcsak a ℚ, hanem minden test részteste egy algebrailag zárt testnek (amelyben már minden nem konstans polinomnak van gyöke, lásd 6.4.6. Tétel). Ha a tételt erre a bővebb testre alkalmazzuk, akkor az alábbi következményt kapjuk.

3.7.4. Következmény. A T test fölötti anxn+...+a0 és bmxm+...+b0 polinomok rezultánsa akkor és csak akkor nulla, ha vagy an=bm=0, vagy a két polinomnak van közös gyöke egy alkalmas T-nél bővebb testben (aminek tehát T részteste).

A rezultánsnak több alkalmazása is van. A szakasz végén megmutatjuk, hogyan lehet egyenletrendszereket megoldani a segítségével. Hasznos a rezultáns akkor is, ha egy polinom többszörös gyökeit akarjuk vizsgálni.

Tudjuk, hogy egy f polinom többszörös gyökei az f-nek és a deriváltjának a közös gyökei, és így az R(f,f') rezultáns akkor lesz nulla, ha a polinomnak van többszörös gyöke. Látni fogjuk azonban, hogy a következő eredmény akkor is hasznos információt nyújt a gyökökről, ha mindegyik csak egyszeres, például segít megállapítani egy valós együtthatós polinom valós gyökeinek a számát.

3.7.5. Tétel. Legyen f(x)=c(x-α1)... (x-αn), ahol c,α1,...,αn egy T test elemei, és c≠ 0 az f főegyütthatója. Ekkor

Bizonyítás. A 3.7.2. Állítás miatt R(f,f')=cn-1 f'(α1)... f'(αn). De

a 3.6.16. Gyakorlat szerint. Ezt az előző képletbe behelyettesítve, és az αij különbségek közül azokat megfordítva, ahol i>j, az állítást kapjuk. □

3.7.6. Definíció. Legyen T test, és az f T[x] nem nulla polinom főegyütthatóját jelölje c. Ekkor a

kifejezést az fdiszkriminánsának nevezzük.

Ha tehát f gyöktényezős alakja f(x)=c(x-α1)... (x-αn) (akár egy bővebb testben), akkor diszkriminánsa a fenti tétel szerint

3.7.7. Következmény. Ha T test, akkor egy T fölötti polinom diszkriminánsa akkor és csak akkor nulla, ha a polinomnak van többszörös gyöke egy alkalmas T-nél bővebb testben.

Megjegyzés

Az R(f,f') rezultánsnak miért a (-1)n(n-1)/2/c-szeresét választottuk f diszkriminánsának? A szakirodalom sem egységes ebben a tekintetben, a fenti választás mellett azonban több komoly érv szól. Egyrészt (az alábbi 3.7.9. Gyakorlat szerint) a másodfokú egyenlet esetében így vissza fogjuk kapni a megoldóképletbeli gyökjel alatti kifejezést, vagyis a diszkrimináns fogalma megegyezik a középiskolában megszokott szóhasználattal. Egy másik ok az, hogy a fenti szorzatformula szerint a diszkrimináns teljes négyzet (és így valós c és αi esetén mindig nemnegatív), ennek jelentőségét az alább bizonyítandó állítás mutatja.

3.7.8. Állítás. Ha f valós együtthatós nem nulla polinom, akkor a diszkriminánsa akkor és csak akkor pozitív, ha minden komplex gyöke egyszeres, és a nem valós komplex gyökeinek száma néggyel osztható.

Bizonyítás. Feltehető, hogy f gyökei egyszeresek, különben a diszkriminánsa nulla, és az állítás igaz. Legyenek f valós gyökei β1,...,βn, a nem valósak pedig (tehát f foka n+2m). Kiszámítjuk a diszkrimináns előjelét a fenti szorzatképlet alapján. Nyilván c2(n+2m)-2>0 és i≠ j esetén (βij)2>0. A βk

konjugáltja , ezért e két szám szorzata valós, a szorzat négyzete pedig pozitív. Vagyis . Hasonlóképpen párosítható i≠ j esetén γij a -vel és a -vel, tehát ezek együtt szintén pozitív számmal járulnak hozzá a diszkriminánshoz. Végül tisztán képzetes, ezért a négyzete negatív valós szám. Ezzel bármely két gyök különbségét számba vettük, és így a diszkrimináns előjele (-1)m, ami akkor és csak akkor pozitív, ha a konjugált nem valós gyökpárok m száma páros. □

3.7.9. Gyakorlat. Legyenek f(x)=ax2+bx+c gyökei α1 és α2. Mutassuk meg, hogy f diszkriminánsa a21 2)2=b2-4ac, vagyis a megoldóképletben a négyzetgyök alatt álló kifejezés. A 3.7.8. Állítás alapján igazoljuk, hogy egy f∈ ℝ[x] polinomnak pontosan akkor valósak a gyökei, ha a diszkriminánsa nemnegatív.

3.7.10. Gyakorlat. Legyen f(x)=x3+px+q. Mutassuk meg, hogy f diszkriminánsa -27q2-4p3, vagyis a Cardano-képletben a négyzetgyök alatt álló D kifejezés -108-szorosa.

3.7.11. Példa. Oldjuk meg az alábbi egyenletrendszert a rezultáns segítségével.

A megoldás során mindkét egyenlet bal oldalát x polinomjának képzeljük, és fölírjuk a rezultánsukat. Az eredmény a következő lesz:

A rezultáns pontosan akkor nulla, ha vagy mindkét főegyüttható nulla, vagy a két polinomnak van közös gyöke.

A két főegyüttható y, illetve y2. Mindkettő akkor és csak akkor nulla, ha y=0. Az első egyenletből világos, hogy erre az y-ra nincs megoldása az egyenletrendszernek, így feltehetjük, hogy y≠ 0. Ebben az esetben az r(y) polinom gyökei azok az y értékek, amelyekre az egyenletrendszer két egyenletének van (az x változóban) közös megoldása.

Az y2 kiemelése után a racionális gyökteszttel megállapíthatjuk, hogy r(y) racionális gyökei 1 és -2. A gyöktényezők kiemelése után y4-y3-y2+4y-2 marad, ami kis ügyeskedéssel két másodfokú polinom szorzatára bontható:

Ha például y=1, akkor az egyenletrendszer első egyenlete x2-1=0, a második x2+x-2=0 lesz. Ezek közös gyöke csak az x=1. Ugyanígy kapjuk az r(y) többi gyökéhez is a megfelelő x értékeket. Végeredményben az egyenletrendszer összes megoldása a következő hat (x,y) pár lesz:

A rezultáns tehát alkalmas arra, hogy két egyenletből egy olyan harmadikat csináljon, amelyben már eggyel kevesebb az ismeretlen. Ha kettőnél több ismeretlen vagy egyenlet van, akkor a módszert többször egymás után kell alkalmazni.

Megjegyzés

A 3.7.11. Példa, illetve az alábbi 3.7.12. Gyakorlat egyenletrendszereit ügyeskedéssel (kivonogatással, szorzattá alakítással) rezultáns nélkül is meg lehet oldani. Ezek azért szerepelnek, hogy megérthessük a rezultáns használata során fellépő jelenségeket. csapdákat, végignézendő eseteket. Ha „igazi” (elemi trükkökkel nem megoldható) példákat választottunk volna, akkor a rezultánsok kiszámítása, a kapott egyismeretlenes egyenlet megoldása is reménytelen lenne, és így a példák nem mondanának semmit az Olvasó számára. Gondoljunk arra is, hogy egy számítógépnek az egyszerű ötletek felismerését is sokkal nehezebb megtanítani, mint egy bonyolult, de algoritmikus számolást elvégeztetni vele.

Gondolkodjunk!

3.7.12. Gyakorlat. A rezultáns módszerével vezessük vissza az alábbi egyenletrendszereket egyismeretlenes egyenletre, és oldjuk is meg őket ℂ fölött. A számításokhoz a Maple program resultant és factor parancsait használjuk.

In document Bevezetés az algebrába (Pldal 94-99)

Outline

KAPCSOLÓDÓ DOKUMENTUMOK