4 Ni 12/21 (EP), 4 Ni 27/22 (EP)
4 Ni 12/21 (EP), 4 Ni 27/22 (EP)
Aktenzeichen
4 Ni 12/21 (EP), 4 Ni 27/22 (EP)
Gericht
BPatG München 4. Senat
Datum
15. September 2022
Dokumenttyp
Urteil
Tenor

In der Patentnichtigkeitssache

betreffend das europäische Patent EP 2 102 619

(DE 60 2007 050 310)

hat der 4. Senat (Nichtigkeitssenat) des Bundespatentgerichts auf Grund der mündlichen Verhandlung vom 16. September 2022 durch die Vorsitzende Richterin Grote-Bittner sowie die Richter Dipl.-Ing. Altvater, Dipl.-Ing. Matter, Dr. Meiser und Dipl.-Phys. Univ. Dr. Haupt

I.

Das europäische Patent 2 102 619wird mit Wirkung für das Hoheitsgebiet der Bundesrepublik Deutschland dadurch teilweise für nichtig erklärt, dass seine Ansprüche die folgende Fassung erhalten:

1.

A transition mode device for use in a predictive-type sound signal codec for producing a transition mode excitation replacing an adaptive codebook excitation in at least one frame following a transition frame in the sound signal, comprising:

an input for receiving a codebook index; and

a transition mode codebook for generating a set of codevectors independent from past excitation, the transition mode codebook being responsive to the codebook index for generating, in the at least one frame following the transition frame, one of the codevectors of the set corresponding to said transition mode excitation;

wherein the transition mode codebook comprises a codebook of glottal impulse shapes.

2.

A transition mode device as defined in claim 1, wherein the sound signal comprises a speech signal and wherein the transition frame is selected from the group consisting of a frame comprising a voiced onset, and a frame comprising a transition between two different voiced sounds.

3.

A transition mode device as defined in claim 1, wherein the at least one frame following the transition frame comprises a plurality of subframes, and wherein the transition mode codebook is used in a first part of the subframes and a predictive-type codebook of the predictive-type codec is used in a second part of the subframes.

4.

A transition mode device as defined in claim 1, wherein the at least one frame following the transition frame comprises a plurality of subframes, and wherein the transition mode codebook is used only in the subframe containing a first glottal impulse of a current frame.

5.

A transition mode device as defined in claim 4, comprising means for producing in at least one subframe preceding the subframe using the transition mode codebook, a global excitation signal comprising exclusively an innovation codebook component.

6.

A transition mode device as defined in claim 1, wherein the codebook of glottal impulse shapes includes a predetermined number of different shapes of glottal impulses, and wherein each shape of glottal impulse is positioned at a plurality of different positions in the codevectors to form a plurality of different codevectors of the codebook of glottal impulse shapes.

7.

A transition mode device as defined in claim 6, wherein the codebook of glottal impulse shapes comprises a generator of codevectors containing only one non-zero element and a shaping filter for processing the codevectors containing only one non-zero element to produce codevectors representing glottal impulse shapes centered at different positions.

8.

A transition mode device as defined in claim 7, wherein the at least one frame following the transition frame comprises a plurality of subframes, the codebook of glottal impulse shapes further comprises a repetition filter positioned downstream of the shaping filter for repeating, when there are more than one glottal impulse per subframe, the glottal impulse shape after a pitch period has elapsed.

9.

A transition mode device as defined in claim 6, wherein the glottal impulse shapes comprise first and last samples wherein a predetermined number of the first and last samples are truncated.

10.

An encoder device for generating a transition mode excitation replacing an adaptive codebook excitation in at least one frame following a transition frame in a sound signal, comprising:

a generator of a codebook search target signal;

a transition mode codebook for generating a set of codevectors independent from past excitation, wherein the codevectors of said set each corresponds to a respective transition mode excitation and wherein the transition mode codebook comprises a codebook of glottal impulse shapes;

a searcher of the transition mode codebook for finding the codevector of said set corresponding to a transition mode excitation optimally corresponding to the codebook search target signal.

11.

An encoder device as defined in claim 10, wherein the searcher applies a given criterion to every glottal impulse shape of the codebook of glottal impulse shapes and finds as the codevector optimally corresponding to the codebook search target signal the codevector of the set corresponding to a maximum value of said criterion.

12.

An encoder device as defined in claim 11, wherein the searcher identifies the found codevector by means of transition mode parameters selected from the group consisting of a transition mode configuration identification, a glottal impulse shape, a position of the glottal impulse shape centre in the found codevector, a transition mode gain, a sign of the transition mode gain and a closed-loop pitch period.

13.

An encoder device as defined in claim 10, wherein the sound signal comprises a speech signal and wherein the transition frame is selected from the group consisting of a frame comprising a voiced onset, and a frame comprising a transition between two different voiced sounds.

14.

An encoder device as defined in claim 10, wherein the at least one frame following the transition frame comprises a plurality of subframes, and wherein the searcher searches the transition mode codebook in a first part of the subframes and a predictive-type codebook of the encoder device in a second part of the subframes.

15.

An encoder device as defined in claim 10, wherein the at least one frame following the transition frame comprises a plurality of subframes, and wherein the transition mode codebook is used only in the subframe containing a first glottal impulse of a current frame.

16.

An encoder device as defined in claim 15, comprising means for producing, in at least one subframe preceding the subframe using the transition mode codebook, a global excitation signal comprising exclusively an innovation codebook component.

17.

An encoder device as defined in claim 10, wherein the codebook of glottal impulse shapes includes a predetermined number of different shapes of glottal impulses, and wherein each shape of glottal impulse is positioned at a plurality of different positions in the codevectors to form a plurality of different codevectors of the codebook of glottal impulse shapes.

18.

An encoder device as defined in claim 17, wherein the codebook of glottal impulse shapes comprises a generator of codevectors containing only one non-zero element and a shaping filter for processing the codevectors containing only one non-zero element to produce codevectors representing glottal impulse shapes centered at different positions.

19.

An encoder device as defined in claim 10, further comprising:

a generator of an innovation codebook search target signal;

an innovation codebook for generating a set of innovation codevectors each corresponding to a respective innovation excitation;

a searcher of the innovation codebook for finding the innovation codevector of said set corresponding to an innovation excitation optimally corresponding to the innovation codebook search target signal; and

an adder of the transition mode excitation and the innovation excitation to produce a global excitation for a sound signal synthesis filter;

wherein the at least one frame following the transition frame comprises a plurality of subframes and wherein, depending on where a glottal impulse or impulses are located in the subframes, the encoder device comprises means for encoding the subframes using at least one of the transition mode codebook, the adaptive codebook and the innovation codebook.

20.

A decoder device comprising the transition mode device as defined in any one of claims 1 to 9, for producing the transition mode excitation replacing the adaptive codebook excitation in the at least one frame following the transition frame in the sound signal.

21.

A decoder device as defined in claim 20, further comprising:

an input for receiving an innovation codebook index;

an innovation codebook for generating a set of innovation codevectors, the innovation codebook being responsive to the innovation codebook index for generating in the at least one frame following the transition frame one of the innovation codevectors of the set corresponding to an innovation excitation;

an adder of the transition mode excitation and the innovation excitation to produce a global excitation for a sound signal synthesis filter.

22.

A transition mode method for use in a predictive-type sound signal codec for producing a transition mode excitation replacing an adaptive codebook excitation in at least one frame following a transition frame in the sound signal, comprising:

providing a transition mode codebook for generating a set of codevectors independent from past excitation, wherein the transition mode codebook comprises a codebook of glottal impulse shapes;

supplying a codebook index to the transition mode codebook; and

generating by means of the transition mode codebook and in response to the codebook index, one of the codevectors of the set corresponding to said transition mode excitation.

23.

A transition mode method as defined in claim 22, wherein the sound signal comprises a speech signal and said method comprises selecting the transition frame from the group consisting of a frame comprising a voiced onset, and a frame comprising a transition between two different voiced sounds.

24.

A transition mode method as defined in claim 22, wherein the at least one frame following the transition frame comprises a plurality of subframes, and said method comprises using the transition mode codebook in a first part of the subframes and a predictive-type codebook of the predictive-type codec in a second part of the subframes.

25.

A transition mode method as defined in claim 22, wherein the at least one frame following the transition frame comprises a plurality of subframes, and wherein said method comprises using the transition mode codebook in the subframe containing a first glottal impulse of a current frame.

26.

A transition mode method as defined in claim 25, comprising producing, in at least one subframe preceding the subframe using the transition mode codebook, a global excitatior signal comprising exclusively an innovation codebook component.

27.

A transition mode method as defined in claim 22, wherein the codebook of glottal impulse shapes includes a predetermined number of different shapes of glottal impulses, and wherein the transition mode method comprises forming in the codebook of glottal impulse shapes a plurality of different codevectors by positioning each shape of glottal impulse at a plurality of different positions in the codevector.

28.

A transition mode method as defined in claim 27, comprising, in the codebook of glottal impulse shapes, generating codevectors containing only one non-zero element and processing through a shaping filter the codevectors containing only one non-zero element to produce codevectors representing glottal impulse shapes centered at different positions.

29.

An encoding method for generating a transition mode excitation replacing an adaptive codebook excitation in at least one frame following a transition frame in a sound signal, comprising:

generating a codebook search target signal;

providing a transition mode codebook for generating a set of codevectors independent from past excitation, the codevectors of said set each corresponding to a respective transition mode excitation, wherein the transition mode codebook comprises a codebook of glottal impulse shapes;

searching the transition mode codebook for finding the codevector of said set corresponding to a transition mode excitation optimally corresponding to the codebook search target signal.

30.

An encoding method as defined in claim 29, wherein searching the transition mode codebook comprises applying a given criterion to every glottal impulse shape of the codebook of glottal impulse shapes and finding as the codevector optimally corresponding to the codebook search target signal the codevector of the set corresponding to a maximum value of said criterion.

31.

An encoding method as defined in claim 29, wherein the sound signal comprises a speech signal and said method further comprises selecting the transition frame from the group consisting of a frame comprising a voiced onset and a frame comprising a transition between two different voiced sounds.

32.

An encoding method as defined in claim 29, wherein the at least one frame following the transition frame comprises a plurality of subframes, and wherein searching the transition mode codebook comprises searching the transition mode codebook in a first part of the subframes and searching a predictive-type codebook of the encoder device in a second part of the subframes.

33.

An encoding method as defined in claim 29, wherein the at least one frame following the transition frame comprises a plurality of subframes, and wherein said method comprises using the transition mode codebook in the subframe containing a first glottal impulse of a current frame.

34.

An encoding method as defined in claim 33, comprising producing, in at least one subframe preceding the subframe using the transition mode codebook, a global excitation signal comprising exclusively an innovation codebook component.

35.

An encoding method as defined in claim 29, wherein the codebook of glottal impulse shapes includes a predetermined number of different shapes of glottal impulses, and the encoding method comprises forming a plurality of different codevectors of the codebook of glottal impulse shapes by positioning each shape of glottal impulse at a plurality of different positions in the codevectors.

36.

An encoding method as defined in claim 35, wherein generating in the glottal-impulse-shape codebook the set of codevectors independent from past excitation comprises generating codevectors containing only one non-zero element and processing through a shaping filter the codevectors containing only one non-zero element to produce codevectors representing glottal impulse shapes centered at different positions.

37.

An encoding method as defined in claim 29, further comprising:

generating an innovation codebook search target signal;

providing an innovation codebook for generating a set of innovation codevectors each corresponding to a respective innovation excitation;

searching the innovation codebook for finding the innovation codevector of said set corresponding to an innovation excitation optimally corresponding to the innovation codebook search target signal; and

adding the transition mode excitation and the innovation excitation to produce a global excitation for a sound signal synthesis filter;

wherein the at least one frame following the transition frame comprises a plurality of subframes and wherein, depending on where the glottal impulse or impulses are located in the subframes, the encoding method comprises encoding the subframes using at least one of the transition mode codebook, the adaptive codebook and the innovation codebook.

38.

A decoding method comprising the transition method as defined in any one of claims 22 to 28 for producing the transition mode excitation replacing the adaptive codebook excitation in the at least one frame following the transition frame in the sound signal.

39.

A decoding method as defined in claim 38, further comprising:

providing an innovation codebook for generating a set of innovation codevectors;

supplying an innovation codebook index to the innovation codebook;

generating, by means of the innovation codebook and in response to the innovation codebook index, one of the innovation codevectors of the set corresponding to an innovation excitation; and

adding the transition mode excitation and the innovation excitation to produce a global excitation for a sound signal synthesis filter.

II.

Die weitergehenden Klagen werden abgewiesen.

III.

Von den Kosten des Rechtsstreits tragen die Klägerinnen 75 % und die Beklagte 25 %.

IV.

Das Urteil ist wegen der Kosten gegen Sicherheitsleistung in Höhe von 120 % des jeweils zu vollstreckenden Betrages vorläufig vollstreckbar.

V.

Der Streitwert wird für die Nichtigkeitsklage der Klägerin zu 1 auf375.000,-- Euro und für die Nichtigkeitsklage der Klägerin zu 2 auf 4.375.000,-- Euro festgesetzt.

Tatbestand

1 Die Nichtigkeitsklage richtet sich gegen das u. a. mit Wirkung für die Bundesrepublik Deutschland erteilte europäische Patent 2 102 619, das auf die internationale Anmeldung PCT/CA2007/001896 (offengelegt als WO 2008/049221) zurückgeht, am 24. Oktober 2007 unter Inanspruchnahme der Priorität der US-Patentanmeldung 853749 vom 24. Oktober 2006 angemeldet und dessen Erteilung am 22. März 2017 veröffentlicht worden ist. Die Beklagte ist eingetragene Inhaberin des im Patentregister des Deutschen Patent- und Markenamts mit der Bezeichnung „Verfahren und Einrichtung zur Codierung von Übergangsrahmen in Sprachsignalen“ eingetragenen Streitpatents, das dort unter dem Aktenzeichen DE 60 2007 050 310 geführt wird.

2 Das Streitpatent umfasst in seiner erteilten Fassung 39 Ansprüche mit den nebengeordneten Vorrichtungsansprüchen 1, 10 und 20, den nebengeordneten Verfahrensansprüchen 22, 29 und 38 sowie den abhängigen Ansprüchen 2 bis 9, 11 bis 19, 21, 23 bis 28,30 bis 37 und 39, die alle direkt oder indirekt auf die Ansprüche 1, 10, 20, 22, 29 und 38 rückbezogen sind.

3 Die Klägerin zu 1 greift das Streitpatent – und im Weiteren alle von der Beklagten mit Hilfsanträgen verteidigten, geänderten Fassungen –im Umfang der Ansprüche 1, 10 und 29 sowie der Unteransprüche 2, 3, 13, 14, 31 und 32 an, die Klägerin zu 2 in vollem Umfang. Die Klägerinnenmachen den Nichtigkeitsgrund der mangelnden Patentfähigkeit wegen fehlender Neuheit und erfinderischer Tätigkeit geltend, die Klägerin zu 2 führt zudem den Nichtigkeitsgrund der nichtausführbaren Offenbarung an.

4 Die Beklagte verteidigt das Streitpatent in der erteilten Fassung sowie in geänderten Fassungen zuletzt mit16 Hilfsanträgen.

5 Die Ansprüche 1 und 10 in der erteilten Fassung lauten in der deutschen Übersetzung und in der maßgeblichen Verfahrenssprache Englisch mit hinzugefügter Merkmalsgliederung wie folgt:

6 Anspruch 1

1.

Übergangsmodus-Einrichtung zur Verwendung in einem Schallsignal-Codec vom Vorhersagetyp

A transition mode device for use in a predictive-type sound signal codec

1.1

zum Erzeugen einer Übergangsmodus-Anregung, die eine adaptive Codebuch-Anregung ersetzt

for producing a transition mode excitation replacing an adaptive codebook excitation

1.1.1

in einem Übergangsrahmen und/oder mindestens einem Rahmen, der auf den Übergang in dem Schallsignal folgt, mit:

in a transition frame and/or at least one frame following the transition in the sound signal, comprising:

1.2

einem Eingang für den Empfang eines Codebuch-Indexes und

an input for receiving a codebook index; and

1.3

einem Übergangsmodus-Codebuch zum Erzeugen eines Satzes von Codevektoren unabhängig von einer früheren Anregung,

a transition mode codebook for generating a set of codevectors independent from past excitation,

1.3.1

wobei das Übergangsmodus-Codebuch auf den Codebuch-Index reagiert, um in dem Übergangsrahmen und/oder dem mindestens einen Rahmen, der auf den Übergang folgt, einen der Codevektoren des Satzes zu erzeugen, welcher der Übergangsmodus-Anregung entspricht,

the transition mode codebook being responsive to the codebook index for generating, in the transition frame and/or the at least one frame following the transition, one of the codevectors of the set corresponding to said transition mode excitation;

1.3.2

wobei das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen aufweist.

wherein the transition mode codebook comprises a codebook of glottal impulse shapes.

21 Anspruch 10

10.

Codiereinrichtung

An encoder device

10.1

zum Erzeugen einer Übergangsmodus-Anregung, die eine adaptive Codebuch-Anregung ersetzt

for generating a transition mode excitation replacing an adaptive codebook excitation

10.1.1

in einem Übergangsrahmen und/oder mindestens einem Rahmen, der auf den Übergang in einem Schallsignal folgt, mit:

in a transition frame and/or at least one frame following the transition in a sound signal, comprising:

10.2

einem Erzeuger eines Codebuch-Suchzielsignals,

a generator of a codebook search target signal;

10.3

einem Übergangsmodus-Codebuch zum Erzeugen eines Satzes von Codevektoren unabhängig von einer früheren Anregung,

a transition mode codebook for generating a set of codevectors independent from past excitation,

10.3.1

wobei die Codevektoren des Satzes jeweils zu einer entsprechenden Übergangsmodus-Anregung gehören und

wherein the codevectors of said set each corresponds to a respective transition mode excitation and

10.3.2

wobei das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen aufweist,

wherein the transition mode codebook comprises a codebook of glottal impulse shapes;

10.4

einer Sucheinrichtung des Übergangsmodus-Codebuchs zum Auffinden des Codevektors des Satzes, der zu einer Übergangsmodus-Anregung gehört, die dem Codebuch-Suchzielsignal optimal entspricht.

a searcher of the transition mode codebook for finding the codevector of said set corresponding to a transition mode excitation optimally corresponding to the codebook search target signal.

38 Wegen des Wortlauts der weiteren Ansprüche in der erteilten Fassung wird auf die Streitpatentschrift verwiesen.

39 Patentanspruch 1 nach Hilfsantrag 1vom 4. Januar 2022 unterscheidet sich vom erteilten Anspruch 1durch die folgenden (durch Durch- und Unterstreichung gekennzeichneten) Änderungen in den Merkmalen 1.1.1 und 1.3.1:

1.1.1HA1

in einem Übergangsrahmen und/oder mindestens einem Rahmen, der auf den  einen Übergang srahmen in dem Schallsignal folgt, mit:

in a transition frame and/or at least one frame following theatransitionframe in the sound signal, comprising:

(....)

1.3.1HA1

wobei das Übergangsmodus-Codebuch auf den Codebuch-Index reagiert, um in dem Übergangsrahmen und/oder dem mindestens einen Rahmen, der auf den Übergang srahmen folgt, einen der Codevektoren des Satzes zu erzeugen, welcher der Übergangsmodus-Anregung entspricht,

the transition mode codebook being responsive to the codebook index for generating, in the transition frame and/or the at least one frame following the transitionframe, one of the codevectors of the setcorresponding to said transition mode excitation;

44 Patentanspruch 10 nach Hilfsantrag 1enthält im Merkmal 10.1.1. eine entsprechende Änderung gegenüber der erteilten Fassung

10.1.1HA1

in einem Übergangsrahmen und/oder mindestens einem Rahmen, der auf den einen Übergang srahmen in einem Schallsignal folgt, mit:

in a transition frame and/or at least one frame following theatransition frame in a sound signal, comprising:

47 Auch die Ansprüche 3,4, 8, 14, 15, 19 bis 22, 24,25, 29, 32, 33, 37 und 38 nach Hilfsantrag 1 sind entsprechendgeändert, die übrigen Ansprüche verbleiben unverändert. Wegen des Wortlauts dieser Ansprüche wird auf den Schriftsatz vom 4. Januar 2022 verwiesen.

48 Wegen des Wortlauts der Patentansprüche nach den weiteren Hilfsanträgen 1a, 2, 2a, 3 bis 5, 5a, 6, 6a, 7, 7a, 8 bis 10 und 10a wird auf die Schriftsätze vom 31. Mai 2022 und vom 24. August 2022 Bezug genommen.

49 Die Klägerin zu 2 vertritt die Auffassung, das geltende Patent sei nicht ausführbar offenbart. Soweit in den Ansprüchen definiert sei, dass das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen aufweise, bleibe für den Fachmann offen, welche Impulsformen zu diesem Codebuch gehörten. Der gesamten Patentschrift sei weder zu entnehmen, wie glottale Impulsformen mathematisch definiert werden, noch wie sie sonst im Allgemeinen erzeugt werden könnten. Gehe man von der Auslegung aus, wonach ein Codebuch, das nur Einheitsimpulse aufweist, kein merkmalsgemäßes Codebuch von glottalen Impulsformen darstelle, offenbare das Streitpatent kein einziges nacharbeitbares Ausführungsbeispiel.

50 Ihr Vorbringen gegen sämtliche im vorliegenden Nichtigkeitsverfahren befindlichen Fassungen des Streitpatents wegen fehlender Patentfähigkeit stützen die Klägerinnen insbesondere auf folgende Druckschriften:

Kurzzeichen

Druckschrift

Klägerin

zu 1

Klägerin

zu 2

K5/

Vary

 VARY, P.; MARTIN, R.: Digital Speech Transmission. Enhancement, Coding and Error Concealment, Wiley © 2006, ISBN 0-471-56018-9, Seiten iii bis xiii, 5 bis 25 und 228 bis 314

K5´/

Vary

 VARY, P.; MARTIN, R.: Digital Speech Transmission. Enhancement, Coding and Error Concealment, Wiley © 2006, ISBN 0-471-56018-9, Seiten iii, iv, 177 bis 199

K6/

Fujimoto

NK4/

Fujimoto

 US 5 864 797 A

K7/

Bergström

 BERGSTRÖM, A.; HEDELIN, P.: Code-Book Driven Glottal Pulse Analysis, International Conference on Acoustics, Speech, and Signal Processing, ICASSP-89, 1989, Seiten 53 bis 56

K9/

Da Silva

NK3/

Da Silva

 DA SILVA, L. M.; ALCAIM, A.: CELP with Priority to Critical Segments, 9th European Signal Processing Conference (EUSIPCO 1998), Rhodos, Griechenland, 8. bis 11. September 1998, IEEE 1998, ISBN 978-960-7620-06-4, 4 Seiten

K10/

Paksoy

NK2/

Paksoy

 PAKSOY, E. et al.: Variable Bit‐Rate CELP Coding of Speech with Phonetic Classification, European Transactions on Telecommunications, Vol. 5, No. 5, 1994, Seiten 591 bis 602

K11/

Wang

 WANG, S.; GERSHO, A.: Phonetically-Based Vector Excitation Coding of Speech at 3.6 kbps, International Conference on Acoustics, Speech and Signal Processing (ICASSP), Glasgow, UK, 23. bis 26. Mai 1989, Seiten 49 bis 52

NK5/

Microsoft

 WO 2006/130229 A1

K13/

Stachurski

 STACHURSKI, J.:A Pitch Pulse Evolution Model for Linear Predictive Coding of Speech, McGill University, Montreal, Dissertation, Februar 1998, Seiten ibis xiv und 1 bis 17

K14/

Berouti

 BEROUTI, M. et al.: Efficient Computation and Encoding of the Multipulse Excitation for LPC, ICASSP '84. IEEE International Conference on Acoustics, Speech, and Signal Processing, San Diego, USA, 1984, Seiten 10.1.1 bis 10.1.4

K15/LBG

 LINDE, Y.; BUZO, A; GRAY, R. M.: An Algorithm for Vector Quantizer design, IEEE Transactions on Communications, Vol. 28, Issue 1, Januar 1980, Seiten 84 bis 95

K17/

Montminy

 MONTMINY, C.; ABOULNASR, T.: Improving the Performance of ITU-T G.729A for VoIP, 2000 IEEE International Conference on Multimedia and Expo, ICME2000 Proceedings (Cat. No.00TH8532), New York, USA, August 2000, Seiten 433 bis 436

K18/

Lindén

NK8/

Lindén

 LINDÉN, J. et al.: Low Rate Speech Coding using a Glottal Pulse Codebook, Proceedings, IEEE Workshop on Speech Coding for Telecommunications, 1995, Date Added to IEEE Xplore: 06 August 2002, Seiten 105 und 106

NK1/

Gersho

 US 6 233 550 B1

K19/

GSM

 GSM-Standard ETS 300 969, GSM 06.20, Version 5.0.1, Mai 1997

K20/

ITU

 ITU Study Group 16 – Contribution 199: Extended high-level description of the Q9 EV-VBR baseline codec, COM 16 – C 199 R1 – E, VoiceAge, Nokia, Juni 2007, Seiten 1 bis 14

K21/

Vaillancourt

 VAILLANCOURT, T. et al.: Efficient Frame Erasure Concealment in Predictive Speech Codecs using Glottal Pulse Resynchronisation, In: IEEE International Conference on Acoustics, Speech and Signal Processing - ICASSP '07, 2007, Seiten IV-1113 bis IV-1116

NK6/

Shlomot

 SHLOMOT, E. et al.: Hybrid Coding: Combined Harmonic and Waveform Coding of Speech at 4 kb/s, IEEE Transactions on Speech and Audio Processing, Vol. 9, No. 6, Seiten 632 bis 646, Sept. 2001

NK7/

Gersho2

 US 6 331 154 B1

NK9/

McElroy

 MCELROY, C. et al.:Wideband Speech Coding using Multiple Codebooks and Glottal Pulses, Proceedings, IEEE International Conference on Acoustics, Speech and Signal Processing, Vol. 1, Seiten 253 bis 256, 1995, ISSN1520-6149

NK10/

Jelinek

 US 2005/0154584 A1

NK11/

Stachurski

 EP 1 035 538 A2

K23/

Kondoz

 KONDOZ, A. M.: Digital Speech. Coding for Low Bit Rate Communication Systems, Wiley, 1994, Seiten i bis xii, 53 bis 59, ISBN 0 471 623717

52 Die Klägerin zu 2 hat zudem – zur Frage der Patentfähigkeit der Gegenstände nach Hilfsantrag 2 –ein Parteigutachten vorgelegt (N…/M…).

53 Die Klägerinnen machen sich schließlich den Vortrag der früheren Klägerin im vormals verbundenen Nichtigkeitsverfahren 4 Ni 47/21 (EP) mit Schriftsatz vom 14. Juni 2022 zu eigen, was u. a. die hiermit vorgelegten Dokumente MFG18/K…

(Parteigutachten; Expert Opinion Prof. K…, 14. Oktober 2021) und MFG19 = K16

(Stellungnahme des britischen Patentamts; H…, D.: Opinion under Section 74A, Opinion Number 20/21, 10. Januar 2022) umfasst.

54 Die Klägerinnenmeinen, bei den Druckschriften K20/ITU-T und K21/Vaillancourthandele es sich um Stand der Technik. Denn das Streitpatent nehme die Priorität vom 24. Oktober 2006 nicht wirksam in Anspruch, da seine unabhängigen Ansprüche nicht die nach der Prioritätsanmeldung zwingend erforderliche Übertragung der Pitchperiode enthielten.

55 Die Klägerinnen vertreten ferner die Auffassung, dass neben anderen insbesondere die Druckschrift K10/NK2/Paksoydem Gegenstand des Streitpatents in seiner erteilten Fassung neuheitsschädlich entgegenstehe.Jedenfalls beruhe das erteilte Streitpatent nicht auf erfinderischer Tätigkeit, weil es durch den Stand der Technik nahgelegt sei.Hierzu führen die Klägerinnen weiter aus.

56 Den Hilfsantrag 1 halten die Klägerinnen bereits für unzulässig. Die Änderung des ursprünglichen Begriffs „transition in a sound signal“ zu „transition frame in a sound signal“ stelle eine Unklarheit im Sinne von Art. 84 EPÜ und eine Schutzbereichserweiterung bzw. ein Aliud dar. Zudem liege damit eine unzulässige Erweiterung vor.

57 Darüber hinaus sei der Gegenstand des Streitpatents in der nach Hilfsantrag 1 verteidigten Fassung nicht neu gegenüber dem Stand der Technik, jedenfalls beruhe er nicht auf erfinderischer Tätigkeit. Hierzu führen die Klägerinnen weiter aus.

58 Der Senat hat den Parteien einen qualifizierten Hinweis vom 14. Oktober 2021 sowie weitere rechtliche Hinweise vom 9. März 2022, 20. Juli 2022 und vom 14. September 2022 erteilt.

59 Die Klägerin zu 1 beantragt,

60 das europäische Patent 2 102 619 im Umfang seiner Ansprüche 1, 2, 3, 10, 13, 14, 29, 31 und 32 mit Wirkung für das Hoheitsgebiet der Bundesrepublik Deutschland für nichtig zu erklären.

61 Die Klägerin zu 2 beantragt,

62 das europäische Patent 2 102 619mit Wirkung für das Hoheitsgebiet der Bundesrepublik Deutschland für nichtig zu erklären.

63 Die Beklagte beantragt,

64 die Klagen abzuweisen,

65 hilfsweise die Klagen mit der Maßgabe abzuweisen, dass das Streitpatent eine der Fassungen gemäß den Hilfsanträgen 1 bis 10a, eingereicht mit den Schriftsätzen vom 4. Januar 2022, 31. Mai 2022, 24. August 2022, in der Reihenfolge 1,1a, 2, 2a, 3, 4, 5, 5a, 6, 6a, 7, 7a, 8, 9, 10, 10a, erhält.

66 Die Beklagte tritt dem Vorbringen der Klägerinnen in allen Punkten entgegen und meint, dass der Gegenstand des erteilten Streitpatents sowohl ausführbar offenbart als auch patentfähig, mithin rechtsbeständig sei.

67 Sie bezieht sich zur Untermauerung ihres Vorbringens zur Patentfähigkeit u. a. auf folgendes Dokument:

NB5

VARY, P. et al.: Digitale Sprachsignalverarbeitung, B. G. Teubner, Stuttgart 1998, ISBN 3-519-06165-1, Seite 64

69 Der Neuheit stehe insbesondere nicht die Druckschrift K10/NK2/Paksoy entgegen, weil sie die Lehre des Streitpatents nicht offenbare.

70 Jedenfalls sei das Streitpatent in den Fassungen nach den zulässigen Hilfsanträgen patentfähig, da der jeweilige Gegenstand ursprungsoffenbart sei und beschränkend wirke. Keine der im vorliegenden Nichtigkeitsverfahren eingeführten Entgegenhaltungenoffenbare sämtliche Merkmale oder lege den Gegenstand des Streitpatents in diesen Fassungen nahe.

71 Dies gelte insbesondere auch für den Gegenstand des Streitpatents in der Fassung nach Hilfsantrag 1, der insbesondere nicht durch die K10/NK2/Paksoy vorweggenommen oder sonst nahegelegt sei.

72 Wegen der weiteren Einzelheiten des Sach- und Streitstandes wird auf die Schriftsätze der Parteien nebst Anlagen und den weiteren Inhalt der Akte Bezug genommen.

Entscheidungsgründe

73 Die Nichtigkeitsklagen, mit denen die Nichtigkeitsgründe der mangelnden ausführbaren Offenbarung der Erfindung und der fehlenden Patentfähigkeit geltend gemacht werden (Art. II § 6 Abs. 1 S. 1 Nr. 1, 2 IntPatÜG i. V. m. Art. 138 Abs. 1 lit. a), b), Art. 54, Art 56 EPÜ), sind zulässig.

74 Sie sind insoweit begründet, als das Streitpatent für nichtig zu erklären ist, soweit es über die von der Beklagten beschränkt verteidigte Fassung nach Hilfsantrag 1 hinausgeht. Der Gegenstand des Streitpatents erweist sich nämlich in der erteilten Fassung als nicht patentfähig.

75 Dagegen ist der Gegenstand des Streitpatents in der Fassung nach dem zulässigen Hilfsantrag 1 sowohl ausführbar offenbart als auch patentfähig, insbesondere ist er neu und beruht zudem auf erfinderischer Tätigkeit. Die Klagen sind daher insoweit unbegründet. Auf die weiteren Hilfsanträge kam es daher nicht mehr an.

I.
1.

Der Streitpatentgegenstand betrifft eine Technik zur digitalen Codierung eines Schallsignals, z. B. eines Sprach- oder Audiosignals, im Hinblick auf dessen Übertragung und Synthese (Streitpatentschrift, Absatz 0001).

77 Laut Streitpatent bezieht sich die Erfindung vor allem auf ein Verfahren und eine Vorrichtung zur Codierung sog. Übergangsrahmen(„transition frames“) und Rahmen, die auf den Übergang in einem Schallsignal folgen, um die Fehlerfortpflanzung am Decodierer im Falle einer Rahmenlöschung zu reduzieren und/oder die Codiereffizienz vor allem am Anfang von stimmhaften Segmenten (sog. „Onset“-Frames) zu erhöhen. Insbesondere ersetze das Verfahren und die Vorrichtung das typischerweise in prädiktiven Codierern verwendete adaptive Codebuch durch ein Codebuch mit glottalen Impulsformen bei Übergangsrahmen und Rahmen, die dem Übergang folgen. Das Codebuch der glottalen Impulsformen könne ein festes Codebuch sein, das unabhängig von der vergangenen Anregung sei, wodurch, sobald die Rahmenlöschung vorüber wäre, Codierer und Decodierer dieselbe Anregung verwenden, so dass die Konvergenz zu einer ungestörten Synthese recht schnell erfolge. Bei der Onset-Rahmencodierung im traditionellen CELP-Verfahren (C ode- E xcited L inear P rediction) werde der Speicher für die vergangene Erregung mit Hilfe der rauschähnlichen Erregung des vorherigen stimmlosen oder inaktiven Rahmens aktualisiert, der sich stark von der aktuellen Erregung unterscheide. Hingegen könne die vorgeschlagene Technik den periodischen Teil der Erregung sehr genau aufbauen (Absatz 0002).

78 Ein aufgrund der Prädiktion bei CELP-basierten Sprachcodierern inhärentes Problem trete bei Übertragungsfehlern (gelöschte Rahmen oder Pakete) auf, nämlich wenn die Zustände von Codierer und Decodierer desynchronisiert werden. Wegen der Prädiktion sei die Auswirkung eines gelöschten Rahmens nicht auf den gelöschten Rahmen beschränkt, sondern breite sich nach der Löschung weiter aus, oft während mehrerer nachfolgender Rahmen, was zu sehr störenden wahrnehmbaren Auswirkungen führen könne (Absatz 0006).

79 Übergänge von stimmlosen zu stimmhaften Sprachsegmenten (z. B. zwischen einem Konsonanten oder einem inaktiven Zeitraum und einem Vokal) oder Übergänge zwischen zwei verschiedenen stimmhaften Segmenten (z. B. Übergänge zwischen zwei Vokalen) seien die problematischsten Fälle für die Verdeckung von Rahmenlöschungen. Wenn ein Übergang von einem stimmlosen zu einem stimmhaften Sprachsegment („voiced onset“, dt. Synonyme:   Einsatz, Ansatz oder Anlaut) verloren gehe, werde keine sinnvolle periodische Anregung im Speicher der vergangenen Anregung (im adaptiven Codebuch) gefunden. Im Codierer baue sich während des Onset-Rahmens die periodische Anregung im adaptiven Codebuch wieder auf, und der folgende stimmhafte Rahmen werde mit dieser codiert. Die meisten Verfahren zur Verdeckung von Rahmenfehlern würden die Informationen des letzten korrekt empfangenen Rahmens verwenden, um den fehlenden Rahmen zu kaschieren. Im Decodierer werde dagegen beim Verlust von Onset-Rahmen der Speicher mit der rauschähnlichen Anregung des vorherigen Rahmens aktualisiert.Somit fehle der periodische Teil der Anregung im adaptiven Codebuch des Decodierers und es könne mehrere Rahmen lang andauern, bis sich der Decodierer von diesem Verlust erholt (Absatz 0007).

80 Eine ähnliche Situation trete bei einem verlorenen stimmhaft-zu-stimmhaft-Übergang auf, da in diesem Fall die im adaptiven Codebuch vor dem Übergangsrahmen gespeicherte Anregung typischerweise sehr unterschiedliche Eigenschaften gegenüber der im adaptiven Codebuch gespeicherten Anregung nach dem Übergang habe, was bei der Kaschierung ebenfalls zu erheblichen Verzerrungen führen könne (Absatz 0008).

81 Eine Aufgabe der vorliegenden Erfindung sei es daher, ein Verfahren und eine Vorrichtung zur Codierung von Übergangsrahmen in einem prädiktiven Sprach- und/oder Audiocodierer bereitzustellen, um die Robustheit des Codierers gegenüber verlorenen Rahmen und/oder die Codiereffizienz zu verbessern. Eine weitere Aufgabe sei es, die Fehlerfortpflanzung in CELP-basierten Codecs zu eliminieren und die Codiereffizienz zu erhöhen, indem die rahmenübergreifende adaptive Codebuchsuche durch eine nicht-prädiktive Suche in einem Codebuch mit z. B. glottalen Impulsformen (“glottal-shape”) ersetzt werde.Dieserfordere keine zusätzliche Verzögerung und hätte eine vernachlässigbare zusätzliche Komplexität sowie keine Erhöhung der Bitrate im Vergleich zur herkömmlichen CELP-Codierung zur Folge (Absätze 0010 und 0011).

82 Diese Aufgaben würden durch eine Übergangsmodus-Einrichtung, eine Codiereinrichtung und eine Decodiereinrichtung gemäß den Vorrichtungsansprüchen 1, 10 und 20 sowie entsprechende Verfahren gemäß den Ansprüchen 22, 29 und 38 gelöst (Absatz 0012).

2.

Als zuständigen Fachmann sieht der Senat einen Ingenieur der Elektro-, Informations- oder Nachrichtentechnik mit Universitätsabschluss (Diplom oder Master) und mehrjähriger Berufserfahrung sowie einschlägigen Kenntnissen auf dem Gebiet der digitalen Signalverarbeitung, insbesondere der Codierung von Audiodaten, dem zum Prioritätszeitpunkt die einschlägigen Verfahren zur Audiodatencodierung, wie insbesondere CELP, sowie deren jeweilige Besonderheiten, Vorteile und Grenzen, geläufig waren. Dieser Fachmann ist auch mit den entsprechenden Standards und den im Rahmen der Standardisierungsprozesse diskutierten Beiträgen zur Weiterentwicklung bestehender Standards vertraut.

3.

Der Gegenstand des Streitpatents und einige Merkmale der Ansprüche bedürfen der Erläuterung:

3.1

Allgemeiner technischer Hintergrund

86 Das Streitpatent geht aus von einem fachüblichen Code-Excited Linear Prediction (CELP)-Sprachcodierer, der dem Fachmann am Prioritätstag des Streitpatents im Rahmen seines allgemeinen Fachwissenswohlbekannt war (Absatz 0042).

87 Das Streitpatent gibt in den Figuren 1 a) (Codierer) und 1 b) (Decodierer) ein schematisches Blockschaltbild eines derartigen CELP-Codecs wieder und beschreibt in den Absätzen 0003 bis 0009 bzw. 0029 bis 0042 dessen Aufbau und Funktionsweise.

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

88 Wie der Fachmann weiß, ist es für die Funktionsweise eines CELP-Codecs essentiell, dass der Inhalt des adaptiven Codebuchs im Sender (Codierer) mit dem Inhalt des adaptiven Codebuchs im Empfänger (Decodierer) übereinstimmt. Denn nur dann wird der Empfänger an der Stelle im adaptiven Codebuch, die der übermittelte Verzögerungsparameter („pitch period“) anzeigt, den adaptiven Codevektor finden, den der Sender in seinem adaptiven Codebuch ermittelt hat.

89 Dieser Rückbezug auf vergangene Abschnitte des Anregungssignals bei der Codierung von Sprachsignalen, in dem das Prinzip der „Prädiktion“ zum Ausdruck kommt, ist sehr effizient, stellt jedoch ein Problem dar, wenn es zu Übertragungsfehlern kommt, und dadurch der Zustand des senderseitigen Codierers mit dem Zustand des empfängerseitigen Decodierers nicht mehr übereinstimmt, d. h. diese desynchronisiert werden. Dieses Problem wird im Absatz 0006 des Streitpatents thematisiert. Aufgrund der Prädiktion ist die Auswirkung eines gelöschten Rahmens zudem nicht auf diesen beschränkt, sondern breitet sich nach der Löschung (zeitlich) weiter aus, oft während mehrerer nachfolgender Rahmen, so dass störend wahrnehmbare Auswirkungen auftreten.

90 Wie das Streitpatent in den Absätzen 0007 und 0008 ausführt, sind die Folgen eines Rahmen- oder Paketverlusts besonders problematisch, wenn dabei der Übergang von einem stimmlosen zu einem stimmhaften Sprachsegment („Onset“; z. B. von einem Konsonanten oder eines inaktiven Zeitraums zu einem Vokal) oder der Übergang zwischen zwei unterschiedlichen stimmhaften Sprachsegmenten (z. B. zwischen zwei Vokalen) verloren geht.

91 Der modifizierte CELP-Codierer nach der technischen Lehre des Streitpatents unterscheidet sich von herkömmlichen CELP-Codierern dadurch, dass bei der Codierung eines Übergangsrahmensund ggf. folgender Rahmen die Anregung aus dem adaptiven Codebuch durch eine sog. Übergangsmodus-Anregung ersetzt wird, die aus einem speziell dafür vorgesehenen Übergangsmodus-Codebuch stammt, dessen Codevektoren unabhängig von einer früheren Anregung sind und sog. glottale Impulsformen aufweisen.

92 Die Figuren 19 a) bis 19 c) veranschaulichen den Effekt dieser streitpatentgemäßen sog. TM-Codierungstechnik („t ransition m ode (TM)“, Übergangsmodus) für ein Sprachsignal im Falle einer Rahmenlöschung eines Onset-Rahmens, nämlich die Abschwächung der Rahmenfehlerfortpflanzung gegenüber einem herkömmlichen CELP-Codec, wobei

·

das Diagramm in Figur 19 a) das zu codierende Eingangssignal darstellt, und im zweiten Rahmen durch das Kreuz der Verlust des Signals bei der Übertragung angedeutet wird;

·

das Diagramm in Figur 19 b) die synthetisierte Ausgangssprache eines gebräuchlichen EV-VBR-Codecs ohne das TM-Codierverfahren darstellt, und

·

das Diagramm in Figur 19 c) die synthetisierte Ausgangssprache eines EV-VBR-Codecs mit der TM-Codierungstechnik darstellt, in dem dessen Vorteile bei der Begrenzung der Rahmenfehlerfortpflanzung im 3., 4. und 5. Rahmen anhand der augenfällig deutlich getreueren Synthetisierung des Sprach-Eingangssignals im Vergleich zu Figur 19 b) zu erkennen sind.

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

3.2

Zum Verständnis einzelner Anspruchsmerkmale

97 Die erläuterungsbedürftigen Angaben, insbesondere in den unabhängigen Ansprüchen 1, 10 und 29 bzw. nebengeordneten Ansprüchen 22, 29 und 38 sind somit im Einzelnen wie folgt auszulegen:

3.2.1

Nach den unabhängigen Ansprüchen 10 und 29 wird eine Codiereinrichtung (encoder device) bzw. ein Codierungsverfahren (encoding method) beansprucht, die zusammen mit der mit den rückbezogenen nebengeordneten Ansprüchen 20 und 38 beanspruchten Decodiereinrichtung (decoder device) bzw. Decodierungsverfahren (decoding method) zu einem vollständigen Codec bzw. Verfahren zur digitalen Codierung, Übertragung und Synthese eines Schallsignals, insbesondere eines Sprachsignal ergänzt werden (vgl. auch Absatz 0001). Lediglich im Anspruch 1 wird der Codec durch das Merkmal 1. explizit noch dadurch konkretisiert, dass die dort beanspruchte und beim Streitpatent insgesamt zentrale Übergangsmodus-Einrichtung zur Verwendung in einem Schallsignal-Codec vom Vorhersagetyp geeignet sein muss. Zusammen mit den in allen unabhängigen Ansprüchen angegebenen Merkmalen, wonach dabei Codebücher, insbesondere auch adaptive Codebücher verwendet bzw. ersetzt werden, geht der Fachmann davon aus, dass es sich erfindungsgemäß um ein hybrides Verfahren zur Audiodatenkompression handelt, das zur Signalformcodierung Vektorquantisierung und parametrische Audiocodierung nutzt. Weiter wird er durch die die Ansprüche nicht einschränkenden Angaben zur Zielsetzung in Absatz 0011, wonach in CELP-basierten Codecs die Fehlerfortpflanzung eliminiert und die Codiereffizienz erhöht werden soll, davon ausgehen, dass die Kernidee des Streitpatents auf der CELP-Codierung basiert und darauf aufbauend ein CELP-Codec weiterentwickelt wird. Damit übereinstimmend wird in Absatz 0024 ausgeführt, dass die vorgeschlagene, als TM-Codierungstechnik („t ransition m ode (TM)“, Übergangsmodus) bezeichnete Weiterentwicklung in jedem CELP-Typ-Codec oder prädiktiven Codec verwendet werden kann. Rein beispielhaft und die Ansprüche nicht beschränkend, wird in der Ausführungsform des Streitpatents die TM-Codierungstechnik in einem ITU-T-standardisierten sog. Embedded Variable Bitrate-Codec (EV-VBR) implementiert beschrieben, wobei aber die Prinzipien und Konzepte nicht auf eine Anwendung in einem EV-VBR-Codec beschränkt sind, sondern auf jeden anderen Codec, der prädiktive Codierung verwendet und auf jede andere Art von Audiosignalen angewendet werden können (Merkmal 1. und Absatz 0024).

3.2.2

Der zentrale Begriff bei der Weiterentwickelung der dem Fachmann wohlbekannten CELP-Codierung im Rahmen des Streitpatents ist der sogenannte Übergang (transition), der die Entitäten Übergangsmodus-Einrichtung (transition mode device; Merkmal 1.), Übergangsmodus-Anregung (transition mode excitation; Merkmale 1.1, 1.3.1; 10.1, 10.3.1, 10.4), Übergangsrahmen (transition frame; Merkmale 1.1.1, 1.3.1; 10.1.1) und Übergangsmodus-Codebuch (transition mode codebook; Merkmale 1.3, 1.3.1, 1.3.2; 10.3, 10.3.2, 10.4) in den unabhängigen Ansprüche charakterisiert.

100 Die technische Lehre, die allen Ansprüchen zugrunde liegt, basiert auf der Idee, eine Übergangsmodus-Einrichtung vorzusehen, die es ermöglicht, im Falle eines Übergangsrahmens im zu codierenden Schallsignal für dessen Codierung und/oder mindestens eines Rahmens, der auf den Übergang folgt, statt einer Anregung aus dem adaptiven Codebuch eine Anregung aus einem für diesen Zweck vorhandenen Übergangsmodus-Codebuch zu verwenden, wobei das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen (glottal impulse shapes) aufweist.

3.2.3

Eine konkrete Definition des Übergangsrahmens (transition frame) ist dem Streitpatent nicht zu entnehmen. Nach dem Unteranspruch 2 wird, die unabhängigen Ansprüche nicht beschränkend, ein Übergangsrahmen aus Rahmen ausgewählt, die entweder einen stimmhaften Einsatz(„voiced onset“) oder einen Übergang zwischen zwei unterschiedlichen stimmhaften Lauten aufweisen. Gemäß der ebenfalls nicht einschränkenden Ausführungsform basiert die Rahmenklassifizierung im EV-VBR-Codec auf der VMR-WB (Variable Rate Multi-Mode Wideband) Klassifizierung und erfolgt unter Berücksichtigung der Verschleierungs- und Wiederherstellungsstrategie. Die TM-Codierungstechnik wird erfolgreich eingesetzt, wenn der Rahmen eines Übergangs verloren gegangen ist, indem dieser Übergangsrahmen und bevorzugt einer oder mehrere nachfolgende Rahmen auf diese Weise codiert werden.

102 In Figur 3 ist als Beispiel für Übergänge ein Segment eines Sprachsignals mit einem Einsatz („ONSET“) und einem stimmhaften Übergang („VOICED TRANSITION“) abgebildet.

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

3.2.4

Die zentrale Komponente bei der erfindungsgemäßen technischen Lehre ist ein Übergangsmodus-Codebuch, welches glottale Impulsformen aufweist („the transition mode codebook comprises a codebook of glottal impulse shapes”;Merkmale1.3.2;10.3.2).

104 In den folgenden Ausführungen wird die in der Elektrotechnik teilweise vorgenommene Differenzierung zwischen „Impuls“, als einem einmaligen Ereignis und „Puls“, als sich wiederholende Folge von Impulsen, nicht berücksichtigt. Vielmehr werden die Begriffe im Wesentlichen synonym verwendet, entsprechend der englischsprachigen Fachliteratur, in der meist kein Unterschied zwischen „impulse“ und „pulse“ gemacht wird.

105 Die Klägerinnen sehen diesesÜbergangsmodus-Codebuch wegen des nichttechnischen Begriffs „glottal“ und wegen einer fehlenden Definition im Streitpatent im Wesentlichen als bereits durch die Verwendung von Einheitspulsen realisierbar an.

106 Die Beklagte hält für das Übergangsmodus-Codebuch eine Anzahl von prototypischen Formen von glottalen Impulsformen, wie exemplarisch und detailliert im Ausführungsbeispiel des Streitpatents beschrieben, für erforderlich, sieht den Begriff „glottale Impulsformen“ als technisch einschlägig an und argumentiert mit Verweis auf NK9/McElroy, dass ein Einheitspuls keine glottale Impulsform darstellen könne.

107 Nach Erkenntnis des Senats versteht der Fachmann die glottalen Impulsformen des erfindungsgemäßenÜbergangsmodus-Codebuchs – wie bereits in den Hinweisen ausgeführt und unter Berücksichtigung der Ausführungen der Parteien – folgendermaßen:

·

Auch wenn es sich bei „glottal“ um einen an sich offensichtlich nichttechnischen Begriff handelt, ist ein „glottaler Impuls“ für den Fachmann auf dem vorliegenden technischen Gebiet ein bekannter Begriff, was beispielsweise bereits durch die Titel der Druckschriften aus dem im Verfahren befindlichen Stand der Technik nach K7/Bergström („Code-Book Driven Glottal Pulse Analysis“), K18/MFG9/NK8/Lindén („Low Rate Speech Coding using a Glottal Pulse Codebook“) und NK9/McElroy(„Wideband speech coding using multiple codebooks and glottal pulses“) belegt wird. Auch in NK6/Shlomot werden Sprachsegmente in „harmonic“, „noise-like“ und „transitions“ eingeteilt und letztere weiter in „onsets, plosives, or nonharmonic glottal pulses“.

·

Ein Übergangsmodus-Codebuch, das lediglich aus wie auch immer angeordneten einzelnen Einheitspulsen („ternäre Pulse“) besteht, ist bereits wegen der Forderung nach einer Mehrzahl von „glottalen Impulsform en “ nicht erfindungsgemäß.

·

Dass eine der mehreren Impulsformen, die ein erfindungsgemäßes Übergangsmodus-Codebuch aufbauen, ein Einheitspuls sein kann, wird durch das Streitpatent – auch wenn dort als nachteilig beschrieben – selbst belegt (Absatz 0079: „In its simplest Form, the shape of the glottal impulse can be represented by a unity impulse… However the performance of such a simple codebook is very limited.“). Dies ist somit weder durch den Anspruchswortlaut noch durch die Beschreibung ausgeschlossen.

·

Da das erfindungsgemäße Übergangsmodus-Codebuch neben möglicherweise enthaltenen Einheitspulsen – welche die denkbar einfachste Impulsform darstellen – weitere Impulsformen aufweisen muss, müssen diese zwangsläufig komplexere Formen als die Einheitspulsform zeigen. Weitere Konkretisierungen bezüglich der Impulsform werden jedoch nicht beansprucht, insbesondere ist das Ausführungsbeispiel, wie in Figur 6 gezeigt und in den zugehörigen Absätzen beschrieben, für die Ansprüche nicht einschränkend.

·

Dem Fachmann ist dabei klar, dass eine komplexe (glottale) Impulsform wegen der Abtastung und Digitalisierung bzw. Quantisierung aus einzelnen zeit- und wertdiskreten (Teil-)Impulsen besteht.

II.

113 Hinsichtlich der erteilten Fassung des Streitpatents liegt der Nichtigkeitsgrund der fehlenden Patentfähigkeit vor (Art. 138 Abs. 1 lit. a) i. V. m. Art. 54 EPÜ i. V. m. Art. II § 6 Abs. 1 S. 1 Nr. 1 IntPatÜG).

1.

Der Gegenstand des Anspruchs 10 erweist sich als nicht neu gegenüber der aus der Druckschrift K10/NK2/Paksoybekannten Codiereinrichtung.

1.1

Der FachartikelK10/NK2/Paksoybeschreibt einen CELP-basierten Codec zur Codierung von Sprache in digitalen Mobilfunkanwendungen mittels variabler Bitrate mit der Bezeichnung „Variable Rate Phonetic Segmentation“ (VRPS). Es wird ein Algorithmus zur Erkennung von Sprachaktivität verwendet, um aktive Sprache von Hintergrundrauschen zu unterscheiden. Jeder Rahmen aktiver Sprache wird weiter klassifiziert, um insbesondere zwischen drei phonetischen Kategorien zu unterscheiden: stimmhaft, stimmlos und Einsatz („onset“). Jedem Eingangsrahmen wird eine von fünf Bitraten entsprechend der Stimmaktivität und der phonetischen Klassifizierung zugeordnet und mit einem Analyse-durch-Synthese-Algorithmus codiert, der auf die Anforderungen der jeweiligen Klasse zugeschnitten ist (Abstract).

116 Die Figur 1 der Druckschrift K10/NK2/Paksoy zeigt ein vereinfachtes Blockdiagramm des VRPS-Kodierungsschemas. Jeder 20 ms-Eingangsrahmen wird zunächst von einem VAD-Sprachaktivitätserkennungs-Algorithmus (Voice Activity Detection) als Front-End analysiert, der entscheidet, ob der Rahmen aktive Sprache (Speech) oder Hintergrundrauschen (Noise,non-speech) enthält. Wenn Hintergrundrauschenerkannt werden, wird mit einer sehr niedrigen Bitrate kodiert (Noise coding). Wird Sprache detektiert, wird der Eingangsrahmen phonetisch in eine von vier möglichen Kategorien klassifiziert (Phonetic classification). Jede dieser Kategorien entspricht einem CELP-Algorithmus, bei dem die Codiererkomponenten und Bit-Zuweisungen an den Inhalt des Sprachrahmens angepasst sind (Class-dependent CELP coding; Figur 1 und Seite 59, linke Spalte, letzter Absatz).

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

117 Aus der Druckschrift K10/NK2/Paksoy ist, in Worten des erteilten Anspruchs 10 ausgedrückt, Folgendes bekannt: Eine

118 10. Codiereinrichtung

119 (Seite 59, linke Spalte, erster Absatz: „In this paper we discuss a speech coder …Our coder, named Variable Rate Phonetic Segmentation (VRPS) … belongs to the family of CELP coders.“ und Seite 62, linke Spalte, Abschnitt 5., zweiter Satz: „The VRPS coder employs a different version of a CELP coding algorithm for each phonetic category.“ sowie Figur 2.)

120 10.1 zum Erzeugen einer Übergangsmodus-Anregung, die eine adaptive Codebuch-Anregung ersetzt

121 10.1.1 in einem Übergangsrahmen und/oder mindestens einem Rahmen, der auf den Übergang in einem Schallsignal folgt, mit:

122 (In K10/NK2/Paksoy wird ein phonetischer Klassifizierungsalgorithmus (phonetic classification) für Rahmen mit aktiver Sprache (active speech) durchgeführt (Abschnitt 4. PHONETIC CLASSIFICATION, Seite 60, rechte Spalte, letzter Absatz bis Seite 62, Tabelle 2), wobei diese stimmhafte (Voiced) oder stimmlose (Unvoiced) Laute oder einen Übergang (Onset) zwischen solchen Lauten umfassen können. Die Codierung wird je nach Klassifizierung des jeweiligen Unterrahmens vorgenommen, wobei zur Vereinfachung angenommen wird, dass jeweils wenigstens zwei gleichartige Unterrahmen aufeinander folgen (vgl. Seite 62, linke Spalte, zweiter Absatz). Somit kann – wie in Tabelle 2 dargestellt – jeder Rahmen in eine von vier Klassen (Class) klassifiziert werden, je nachdem, aus welchen Unterrahmen (Subframe) er besteht.

123 Übergangsrahmen im Sinne des Streitpatents sind somit Rahmen der Klassen „UO“ und „OV“, die einen Übergang von stimmlosen (Unvoiced) zu Einsatz-Unterrahmen (Onset) bzw. von Einsatz-Unterrahmen (Onset) zu stimmhaften Unterrahmen (Voiced) betreffen und die Einsatz-Unterrahmen einen Übergang von stimmlos zu stimmhaft enthalten (Seite 63Brückenabsatz linke/rechte Spalte: „5.1.3. Onset subframes … a transition from an unvoiced sound to a voiced sound, the glottal excitation undergoes a very rapid change.“.)

124 Wie in Abschnitt „5. CODING STRATEGIES“ beschrieben, ist je nach Klassifizierung eines Unterrahmens für die Codierung im Hinblick auf die Erzeugung einer Anregung ein Codieralgorithmus sowie ein entsprechendes Codebuch (shape codebook) festgelegt (Seite 62, linke Spalte, letzter Absatz: „The VRPS coder employs a different version of a CELP coding algorithm for each phonetic category.“ und Seite 62, rechte Spalte, zweiter Absatz: „Since VRPS is a CELP-type coder, the excitation parameters are shape vectors and gains selected from appropriate codebooks using an analysis-by-synthesis search technique. The properties of each shape codebook are determined by the properties of the phonetic class to be coded.“).

125 Die zu den Übergangsrahmen gehörenden Codebücher stellen damit Übergangsmodus-Codebücher im Sinne des Streitpatents dar und dienen zum Erzeugen einer Übergangsmodus-Anregung, deren Codierung in Abschnitt „5.1.3. Onset subframes“ beschrieben wird.

126 Ein adaptives Codebuch ist für den ersten stimmhaften Unterrahmen nach einem stimmlosen Unterrahmen nicht in der Lage, die periodischen Tonhöhenpulse („pitch pulses.“) mit ausreichender Güte die Anregung zu bilden, da in den vorangehenden stimmlosen Unterrahmen keine derartigen Tonhöhenpulse enthalten sind (Seite 63 rechte Spalte, erster Absatz: „Consider the first voiced subframe detected following an unvoiced segment. … An adaptive codebook will be unsuccessful in capturing these pitch pulses since the previous subframe is unvoiced and the past excitation does not contain any pitch pulses. Therefore it will not offer a useful first approximation to the overall excitation.“), was zur Qualitätsverminderung der synthetisierten Sprache für mehrere Unterrahmen führt (Seite 63, rechte Spalte, erster Absatz, letzter Satz: „Consequently, poor coding of the onset will degrade the quality of the synthesized speech for several subframes.“).

127 Deshalb wird im Codec nach K10/NK2/Paksoy die adaptive Codebuch-Anregungdurch eine Übergangsmodus-Anregungersetzt, die als zweistufige Anregung ausgeführt wird, wobei jede Stufe ein 10-Bit-Codebuch umfasst und in der ersten Stufe die Tonhöhenimpulse nachgebildet werden (Brückenabsatz Seite 63/64: „VRPS provides a remedy for this situation … thereby ensuring an effective coding of such transitions.We code onsets using a two-stage excitation structure. Each stage is a 10 bit sparse codebook. The first stage is intended to accurately capture the pitch pulses.“). Figur 3 gibt den Effekt der Onset-Kodierung wieder. Die mittlere Abbildung (b) zeigt, dass die Tonhöhenimpulse, die im Original (a) vorhanden sind, erkennbar besser reproduziert werden, im Vergleich zu einer Methode, mit der Onset-Übergangsrahmen als stimmhaft codiert werden (c).

128 10.2 einem Erzeuger eines Codebuch-Suchzielsignals,

129 (Dem Codebuch-Suchzielsignal im Streitpatent entspricht in K10/NK2/Paksoy das Referenzsignal s(n), aus dem durch Differenzbildung mit dem aus den verwendeten Codebüchern gebildeten Anregungssignal

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

(n) der Restfehler e(n) bestimmt und anschließend minimiert wird, wie im unteren rechten Teil der Figur 2 schematisch dargestellt. Dabei ist es für den Fachmann selbstverständlich, dass das Codebuch-Suchzielsignal s(n) vorher durch einen – in der Sprache des Streitpatents– „Erzeuger“, wie bei CELP-Codecs üblich, bereitgestellt und insbesondere durch verschiedene Komponenten wie Filter in ein geeignetes Format gebracht wird.)

130 10.3 einem Übergangsmodus-Codebuch zum Erzeugen eines Satzes von Codevektoren unabhängig von einer früheren Anregung,

131 10.3.1 wobei die Codevektoren des Satzes jeweils zu einer entsprechenden Übergangsmodus-Anregung gehören und

132 (K10/Paksoy weist für die Einsatz-Übergangs(unter)rahmen (onset subframes) eine zweistufige Anregungsstruktur auf, bei der statt des adaptiven Codebuchs ein dünnbesetztes Codebuch (sparse codebook) mit 10 Bit verwendet wird, das jeweils feste Sätze von Codevektoren mit Einheitspulsen und zentralbeschnittenen Gaußschen Vektoren enthält (Brückenabsatz Seite 63/64: „We code onsets using a two-stage excitation structure. Each stage is a 10 bit sparse codebook. The first stage is intended to accurately capture the pitch pulses. It contains ternary codewords with one and two non-zero pulses (+1 or -1), with a minimum pulse separation of 20 samples, as well as center-clipped, Gaussian vectors. The second stage must code the stochastic part of the excitation, and consists of center-clipped unit-variance, Gaussian vectors.“). Bei diesem handelt es sich somit um ein festes, also nicht von früheren Anregungen abhängiges, Übergangs-Codebuch. Da die in diesem enthaltenen Codevektoren nach CELP-üblicher Suche für jeden Einsatzrahmen eine passende Anregung bereitstellen, gehören sie damit jeweils zu einer entsprechenden Übergangsmodus-Anregung.)

133 10.3.2 wobei das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen aufweist,

134 (Die Übergangsmodus-Codebücher enthalten sog. „sparse codebooks“, die Codevektoren mit nur wenigen („spärlich“ besetzt) von Null verschiedene Komponenten aufweisen, wobei in dem für die periodischen Anteile verantwortlichen Codebuch der ersten Stufe neben Einheitsimpulsen (sog. ternäre bzw. +1 und -1-Pulse) auch zentralbeschnittene gaußförmige Vektoren enthalten sind (Seite 64, linke Spalte, erster Absatz: „Each stage is a 10 bit sparse codebook. The first stage is intended to accurately capture the pitch pulses. It contains ternary codewords with one and two non-zero pulses (+1 or -1), with a minimum pulse separation of 20 samples, as well as center-clipped, Gaussian vectors.“). Da auch das Streitpatent Einheitsimpulse als mögliche – wenn auch als nachteilig beschriebene – glottale Impulsformen angibt (vgl. Absatz 0079) und die Übergangsmodus-Codebücher nach K10/NK2/Paksoy zusätzlich gaußartige Impulsformen enthalten, weisen sie anspruchsgemäß (mehrere) glottale Impulsformen im Sinne des Streitpatents auf (vgl. Absatz 0079 und die obigen Ausführungen zur Auslegung in Abschnitt I. 3.2.4). Da diese offensichtlich dazu geeignet sind, glottale Anregungen für Onset-Übergangsrahmen zu erzeugen (Seite 63, Brückenabsatz linke/rechte Spalte: „the glottal excitation“), offenbart K10/Paksoy sowohl dem Wortlaut nach als auch funktional ein Übergangsmodus-Codebuch, das glottale Impulsformen aufweist.)

135 10.4 einer Sucheinrichtung des Übergangsmodus-Codebuchs zum Auffinden des Codevektors des Satzes, der zu einer Übergangsmodus-Anregung gehört, die dem Codebuch-Suchzielsignal optimal entspricht.

136 (Da es sich bei der in K10/NK2/Paksoy beschriebenen Codiervorrichtung um einen auf dem CELP-Modell aufbauenden Codec handelt, findet auch bei diesem eine iterative Suche im Übergangsmodus-Codebuch durch Fehlerrückführung zur Auswahl des Codevektors und Entnahme der Anregung statt, basierend auf dem Vergleich der entnommenen Anregung mit dem Referenzsignal, wobei der Codierfehler minimiert wird und somit der gefundene Übergangs-Codevektor zu der Übergangsmodus-Anregung gehört, die dem Codebuch-Suchzielsignal optimal entspricht, vgl. dazu auch die zu Merkmal 10.2 wiedergegebene Figur 2: und darin „

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

(n)“, „e(n)“, „s(n)“ „Error minimization“ sowie „Excitation selection“.)

137 Danach ist die Codiereinrichtung des Anspruchs 10 erteilter Fassung vollständig aus K10/NK2/Paksoy bekannt.

1.2

Der Ansicht der Beklagten, der Fachmann würde weder die Einheitsimpulse(„ternary codewords with one and two non-zero pulses (+1 or -1)”) noch die zentralbeschnittenen gaußförmigen Vektoren(„center-clipped, Gaussian vectors“)des Übergangsmodus-Codebuchs der Codiereinrichtung nach K10/NK2/Paksoy als glottale Impulsformen im Sinne des Streitpatents (Merkmal 10.3.2) verstehen, folgt der Senat nicht.

139 Zum einen handelt es sich bei den ternären Codewörtern mit einem oder zwei von Null verschiedenen Einheitsimpulsen um eine mögliche glottale Impulsform im Sinne des Streitpatents, was auch im Streitpatentselbst so beschrieben wird (Absatz 0079: „In its simplest form, the shape of the glottal impulse can be represented by a unity impulse“). Dass diese Impulsform dort als einfachste und nachteilige Form beschrieben wird, da die Leistungsfähigkeit eines damit aufgebauten Codebuchs sehr begrenzt sei, ändert daran nichts, insbesondere, weil sowohl beim Streitpatent als auch bei der Codiereinrichtung nach K10/NK2/Paksoydas jeweilige Übergangsmodus-Codebuch nicht nur diese eine Impulsform aufweist.

140 Zum anderen stellen die zentralbeschnittenen Gaußschen Vektorendes Übergangsmodus-Codebuchs der Codiereinrichtung nach K10/NK2/Paksoy eine zweite glottale Impulsform im Sinne des Streitpatents dar, da diese aus einzelnen Komponenten mit zufällig verteilten Werten in ihrer Gesamtheit komplexere als die nur aus Einheitsimpulsen bestehenden Codevektoren bilden. Dem steht auch nicht entgegen, dass diese „ausgedehnte rauschartige Signalsegmente darstellen“ und einen stochastischen Charakter haben, da der Anspruchswortlaut dies nicht ausschließt, sondern zur konkreten Form der glottalen Impulse keine Vorgaben macht.Somit ist durch das Übergangsmodus-Codebuch mit den Einheitsimpulsen und zentralbeschnittenen gaußförmigen Pulsen die in Merkmal 10.3.2geforderte Ausgestaltung nach einer Mehrzahl von Impulsformenerfüllt.

141 Zudem ist auch die funktionelle Forderung für die glottalen Impulsformen des erfindungsgemäßen Übergangsmodus-Codebuchs durch die erste Stufe des Übergangsmodus-Codebuchs der K10/NK2/Paksoyerfüllt, da ungeachtet der einfachen Form der Einheitspulse und des statistischen Charakters der Gaußsche Vektoren diese als geeignet beschreiben werden, die „pitch pulses“ eines „onsets“ bzw. glottale Anregungen (Seite 63, Brückenabsatz linke/rechte Spalte: „the glottal excitation“) bereitzustellen, da die zweite Stufe lediglich als Rest den stochastischen Anteil des Anregungssignals codiert (Abschnitt 5.1.3, Brückenabsatz Seite 63/64).

1.3

Die vorstehenden Ausführungen für die Codiereinrichtung nach Anspruch 10 gelten in entsprechender Weise für die dazu korrespondierende Decodiereinrichtung nach dem nebengeordneten Anspruch 20, sowie die Übergangsmodus-Einrichtung zur Verwendung in einem Schallsignal-Codec vom Vorhersagetyp nach Anspruch 1, auf den sich dieser rückbezieht. Gleiches gilt für die entsprechenden Verfahren gemäß den Ansprüchen 22, 29 und 38.

III.

143 Die Fassung des Streitpatents nach Hilfsantrag 1 vom 4. Januar 2022 verteidigt die Beklagte erfolgreich. Der Hilfsantrag 1 ist zulässig, da der Gegenstand des Streitpatents in dieser Fassung weder unzulässig erweitert noch unklar ist oder ein Aliud darstellt und die geänderte Fassung beschränkend wirkt. Der Gegenstand des Streitpatents in dieser verteidigten Fassung erweist sich als rechtsbeständig, weil er ausführbar offenbart und patentfähig, insbesondere neu ist und auf erfinderischer Tätigkeit beruht.

1.

Der Anspruch 10 nach Hilfsantrag 1 unterscheidet sich vom erteilten Anspruch 10 dadurch, dass dessen Merkmal 10.1.1 folgendermaßen verändert gefasst ist (mit Hervorhebung der Ergänzungen und Streichungen gegenüber der erteilten Fassung):

145 10.1.1HA1 in einem Übergangsrahmen und/oder mindestens einem Rahmen, der auf den einen Übergangsrahmen in einem Schallsignal folgt, mit:

in a transition frame and/or at least one frame following thea transition frame in a sound signal, comprising:

147 Zum Erzeugen der Übergangsmodus-Anregung, welche die adaptive Codebuch-Anregung ersetzt, waren in der erteilten Fassung drei Alternativen beansprucht, wonach

1)

der jeweilige Übergangsrahmen selbst

149 oder

2)

mindestens ein auf den Übergang folgender Rahmen

151 oder

3)

der Übergangsrahmen selbst und ein oder mehrere auf den Übergang folgende(r) Rahmen

153 im Übergangsmodus codiert wird/werden. Im Hilfsantrag 1 ist die Übergangsmodus-Anregung nunmehr auf mindestens einen Rahmen nach einem Übergangsrahmen gemäß den Alternativen 2 und 3 beschränkt. Die Alternative der Erzeugung der Übergangsmodus-Anregung nur im jeweiligen Übergangsrahmen selbst (Alternative 1) erfüllt demnach diese Anforderung nicht mehr.

154 Somit versteht der Fachmann die Formulierung in Hilfsantrag 1 so, dass die Ersetzung in einem auf den Übergangsrahmen folgenden Rahmen zwingend vorgeschrieben und in weiteren, auf den Übergangsrahmen folgenden Rahmen und dem Übergangsrahmen selbst dagegen lediglich nicht ausgeschlossen ist, da das Codebuch zumindest in einem (unmittelbar)auf den Übergangsrahmen folgenden Rahmen ersetzt wird („…replacing an adaptive codebook excitation in at least one frame following a transition frame…“).

155 Weiterhin kann zur Überzeugung des Senats der Fachmann den Wortlaut des Anspruchs 10 nach Hilfsantrag 1 nicht so verstehen, dass die Vorgaben aus Merkmal 10.1.1HA1 bereits erfüllt wären, wenn der auf den Übergang folgende Rahmen (zufällig) wieder ein Übergangsrahmen ist und deshalb im Übergangsmodus codiert wird. Vielmehr erkennt er, dass der auf den Übergang folgende Rahmen in jedem Fall derart codiert werden muss, d. h. unabhängig davon, ob es sich um einen Übergangsrahmen handelt oder nicht.

156 Schließlich versteht der Fachmann die Formulierung „… one frame following a transition frame in a sound signal“ im Kontext des Streitpatents so, dass der damit bezeichnete nachfolgende Rahmen unmittelbar auf den Übergangsrahmen folgen muss. Um der Fehlerpropagation entgegenzuwirken, stellt ein beliebig später folgender Rahmen keine Lösung dar, insbesondere nicht ein irgendwann folgender weiterer Übergangsrahmen.

2.

Der Anspruch 10 nach Hilfsantrag 1 ist zulässig.

2.1

Der Anspruch 10 nach Hilfsantrag 1 geht nicht über den Inhalt der Anmeldung in der ursprünglichen Fassung (WO 2008/049221 A1 = Anlage K2a) hinaus (Art. II § 6 Abs. 1 S. 1 Nr. 3 IntPatÜG i. V. m. Art. 138 Abs. 1 lit. c) EPÜ).

159 Die Klägerinnenwenden sinngemäß ein, gemäß Hilfsantrag 1 würde in den gegenüber der erteilten Fassung geänderten Ansprüchen ein nur in der Codierung existierendes Merkmal, nämlich der Übergangsrahmen, mit einem auf den Stimmerzeugungsapparat bezogenen Merkmal kombiniert, indem von einem „Übergangsrahmen in einem Schallsignal“ die Rede sei und dieser zum Bezugspunkt für die Verwendung der Übergangsmodus-Anregung gemacht werde. In Schallsignalen, d. h. vom Stimmapparat erzeugten Signalen, gäbe es aber nur Übergänge (z. B. von einem stimmlosen zu einem stimmhaften Laut), aber keine Übergangsrahmen, denn Rahmen würden erst im Zuge der Codierung eingeführt. Entsprechend könnten Übergangsrahmen in Schallsignalen auch nicht ursprungsoffenbart sein.

160 Diese Auffassung vermag der Senat nicht zu teilen, denn die Änderung der Begriffe führt nicht zu einer inhaltlichen Änderung und damit auch nicht zu einer unzulässigen Erweiterung.

161 Bereits durch die Formulierung des erteilten Anspruchs 10, in dem die beiden Angaben „Übergangsrahmen“ („transition frame“) bzw. „Rahmen“ („frame“) einerseits und „Übergang“ („transition“) bzw. „Schallsignal“ („sound signal“) andererseits miteinander in Beziehung gesetzt werden, erkennt der Fachmann, dass von Signalen der gleichen „Kategorie“ die Rede ist. Dass es sich dabei in jedem Fall um ein codiertes bzw. digitalisiertes also abgetastetes und quantisiertes Signal handelt, ist für den Fachmann im Kontext des Streitpatents selbstverständlich, wird aber beispielsweise auch aus einer Zusammenschau der Figuren 1 und 27 i. V. m. der zugehörigen Beschreibung deutlich:

162 In Figur 27 ist der „A/D-Converter 902“ dem „Speech Encoder 903“ vorgeschaltet, der dem Codiererder Figur 1a entspricht. Das in den Codierer eingespeiste Signal „input speech signal s(n)“ liegt bereits diskret vor und ist in Rahmen und Unterrahmen eingeteilt (Absatz 0031: „… where discrete time index n = 0, 1, ..., N-1, and N is the length of the subframe.“). Nicht abgetastete „analoge“ Schallsignale kommen in der technischen Lehre des Streitpatents nicht vor.

2.2

Die Ansprüche nach Hilfsantrag zu 1 sind deutlich und knapp gefasst und von der Beschreibung gestützt (Art. 84 EPÜ).

164 Auch sieht der Senat, anders als die Klägerin zu 1, in der Ersetzung von „transition“ durch „transition frame“ in den geänderten Ansprüchen gemäß Hilfsantrag 1 keine „Unklarheit“ im Sinne von Art. 84 EPÜ, da diese dem Fachmann keinerlei Verständnisschwierigkeiten bereitet und er diese im Kontext der konkreten technischen Lehre als Synonyme versteht (vgl. den vorangehenden Abschnitt III. 2.1).

2.3

Ebenso bestehen gegen die Änderungen der Patentansprüche in der beschränkten Fassung nach Hilfsantrag 1 keine Bedenken hinsichtlich des Nichtigkeitsgrundes nach Art. II § 6 Abs. 1 S. 1 Nr. 4 IntPatÜG i. V. m. Art. 138 Abs. 1 lit. d) EPÜ.

166 Denn durch die Konkretisierung nach Hilfsantrag 1 liegt eine Anspruchsfassung vor, die den Schutzbereichgegenüber der erteilten Fassung nicht erweitert, sondern einschränkt. Statt der Verwendung aller drei Alternativen, welche die Formulierung des Merkmals der erteilten Fassung umfasst, wird lediglich noch eine Teilmenge davon beansprucht (siehe auch Abschnitt III.1.). Damit stellen diese Änderungen auch eine grundsätzlich zulässige Beschränkung gegenüber der erteilten Fassung durch ein ursprünglich offenbartes Merkmal dar.

167 Im Übrigen teilt der Senat den Einwand der Klägerinnen nicht, wonach sich durch die Ersetzung von „transition“ durch „transition frame“ in den geänderten Ansprüchen gemäß Hilfsantrag 1 eine Verschiebung des Schutzbereichs des Streitpatents im Sinne eines Aliuds ergeben würde, wozu auf die Ausführungen in den vorangehenden Abschnitten III. 2.1 und III. 2.2 verwiesen wird.

3.

Das Streitpatent offenbart die Erfindung so deutlich und vollständig, dass ein Fachmann sie ausführen kann (Art. II § 6 Abs. 1 S. 1 Nr. 2 IntPatÜG, Art. 138 Abs. 1 lit. b EPÜ).

169 Die Klägerin zu 2 macht den Nichtigkeitsgrund der mangelnden Ausführbarkeit geltend und führt sinngemäß aus, dass der Fachmann aufgrund der diesbezüglichen Offenbarung des Streitpatents nicht in der Lage wäre, ein erfindungsgemäßes Codebuch von glottalen Impulsformen zu implementieren.

170 Eine Erfindung ist ausführbar offenbart, wenn der Fachmann ohne erfinderisches Zutun und ohne unzumutbare Schwierigkeiten in der Lage ist, die Lehre des Patentanspruchs auf Grund der Gesamtoffenbarung der Patentschrift in Verbindung mit dem allgemeinen Fachwissen so zu verwirklichen, dass der angestrebte Erfolg erreicht wird. Dabei reicht es aus, wenn dem Fachmann ein allgemeines Lösungsschema an die Hand gegeben wird. Der Patentanspruch muss nicht alle zur Ausführung der Erfindung erforderlichen Angaben enthalten (Urteil vom 13. Juli 2021 – X ZR 81/19, GRUR 2022, 59-67, Rn. 59 – Diskontinuierliche Funkverbindung). Vielmehr genügt es, wenn der Fachmann die insoweit notwendigen Einzelangaben der allgemeinen Beschreibung oder den Ausführungsbeispielen entnehmen kann (BGH, Urteil vom 28. März 2017 – X ZR 17/15, juris, Rn. 23 m. w. N.).

171 Diese Anforderung wird vom Streitpatent erfüllt. Denn insbesondere in Absatz 0081 wird ein bevorzugtes Verfahren zum Erzeugen eines Codebuchs von glottalen Impulsformen detailliert beschrieben. Ein LP-Residualsignal wird aus einer Sprachdatenbank mit einem mehr als dreistündigen Sprachsignal verschiedener Sprecher in mehreren Sprachen erzeugt, bevor daraus glottale Impulse mit 17 Abtastwerten um das Maximum extrahiert werden. Mittels eines k-means-Algorithmus werden aus diesen sodann 16 prototypische Impulsformen ausgewählt, von denen acht Impulsformen experimentell bestimmt werden – wie exemplarisch in Figur 6 dargestellt – die schließlich das Codebuch von glottalen Impulsformen gemäß dem bevorzugten Ausführungsbeispiel des Streitpatents bilden.

172 Das Streitpatent enthält mit diesem Ausführungsbeispiel in der Beschreibung sehr konkrete technische Angaben, die den Fachmann ohne Weiteres in die Lage versetzen, die technische Lehre hinsichtlich des erfindungsgemäßen Codebuchs von glottalen Impulsformen nachzuarbeiten.

4.

In der Fassung nach Hilfsantrag 1 erweist sich das Streitpatent als patentfähig(Art. 138 Abs. 1 lit. a) i. V. m. Art. 54, 56 EPÜ i. V. m. Art. II § 6 Abs. 1 S. 1 Nr. 1 IntPatÜG).

4.1

Entgegen der Ansicht der Klägerin zu 1nimmtdas Streitpatent, auch in der Fassung des Hilfsantrags 1, die Priorität aus der Voranmeldung (US 853749 P = K22) wirksam in Anspruch (Art. 87 Abs. 1 EPÜ).

175 Die wirksame Inanspruchnahme der Priorität einer früheren Anmeldung setzt nach Art. 87 Abs. 1 EPÜ voraus, dass diese dieselbe Erfindung betrifft. Diese Voraussetzung ist erfüllt, wenn die mit der späteren Anmeldung beanspruchte Merkmalskombination in der früheren Anmeldung in ihrer Gesamtheit als zu der angemeldeten Erfindung gehörend offenbart ist (BGH GRUR 2002, 146 – Luftverteiler; GRUR 2008, 597, 599 – Betonstraßenfertiger). Hierfür sind nicht allein die in der früheren Anmeldung formulierten Ansprüche maßgeblich; der Offenbarungsgehalt ist vielmehr aus der Gesamtheit der Anmeldeunterlagen zu ermitteln (BGH GRUR 2014, 542 Rn. 21- Kommunikationskanal; GRUR 2021, 1162 Rn. 35 - Bodenbelag). Für die Beurteilung der identischen Offenbarung gelten die Prinzipien der Neuheitsprüfung (BGH GRUR 2004, 133, 135 - Elektronische Funktionseinheit). Nach der ständigen Rechtsprechung des BGH ist danach erforderlich, dass der Fachmann die im Anspruch bezeichnete technische Lehre den Ursprungsunterlagen unmittelbar und eindeutig als mögliche Ausführungsform der Erfindung entnehmen kann (vgl. etwa BGH GRUR 2002, 146 – Luftverteiler; GRUR 2010, 910 Rn. 62 – Fälschungssicheres Dokument; GRUR 2012, 1133 Rn. 31 - UV-unempfindliche Druckplatte; GRUR 2016, 50 Rn. 29 – Teilreflektierende Folie; BGH, Urteil vom 10. Mai 2022, X ZR 55/20, juris Rn. 28 – Computerkühlsystem).

176 Die Klägerin zu 1meint eine mangelnde Erfindungsidentität zwischen dem Gegenstand des Hilfsantrags 1 und dem Gegenstand des Prioritätsdokuments zu erkennen, da der letztere nur mit dem ausdrücklichen Erfordernis offenbart wäre, dass die „Pitchperiode“ für Übergangsrahmen („TM frame“) übertragen werden müsse (K22, Seite 28, erster Absatz: „necessary to transmit in every TM frame the absolute value of the pitch period“ und Seite 34, letzter Absatz: „the pitch period T0needs to be transmitted“), wohingegen bereits in der Streitpatentanmeldung diese zwingende Vorgabe in ein optionales Merkmal umgeändert wäre (Streitpatentanmeldung (K2a), Seite 51, Absatz 0153: „the absolute value of the pitch period can be transmitted in every TM frame“ und Seite 64, Absatz 0172: „the pitch period T0is transmitted“). Dies stelle eine Verallgemeinerung jenseits des Offenbarungsgehalts der Prioritätsanmeldung für alle unabhängigen Streitpatentansprüche einschließlich aller Hilfsanträge dar, so dass die Prioritätsbeanspruchung unwirksam sei und diese Anspruchsgegenstände damit nicht den Zeitrang der Prioritätsanmeldung, sondern nur denjenigen des Anmeldetags der Streitpatentanmeldung, d. h. den 24. Oktober 2007 hätten.

177 Diese Auffassung teilt der Senat nicht.

178 Zwar trifft es zu, dass in den zitierten Textstellen der Prioritätsschrift die Übertragung der Pitchperiode T0 für Übergangsrahmen als notwendig dargestellt wird, was im Streitpatent, insbesondere in den Ansprüchen, keinen Niederschlag gefunden hat.

179 Es trifft jedoch nicht zu, dass es sich dabei um eine Verallgemeinerung der ursprünglichen technischen Lehre der Prioritätsanmeldung handeln würde, die dazu führt, dass die Inanspruchnahme der Priorität unwirksam wäre.

180 Zum einen muss bei der Beurteilung des Erfordernisses einer unmittelbaren und eindeutigen Offenbarung berücksichtigt werden, dass die Ermittlung dessen, was dem Fachmann als Erfindung und was als Ausführungsbeispiel der Erfindung offenbart wird, wertenden Charakter hat, und eine unangemessene Beschränkung des Anmelders bei der Ausschöpfung des Offenbarungsgehalts der Voranmeldung vermeidet. Insoweit ist zugrunde zu legen, dass das Interesse des Anmelders regelmäßig erkennbar darauf gerichtet ist, möglichst breiten Schutz zu erlangen, also die Erfindung in möglichst allgemeiner Weise vorzustellen und nicht auf aufgezeigte Anwendungsbeispiele zu beschränken. Erst im Verlauf des sich anschließenden Prüfungsverfahrens ist herauszuarbeiten, was unter Berücksichtigung des Standes der Technik schutzfähig ist und für welche Ansprüche der Anmelder Schutz begehrt. Erst mit der Erteilung des Patents mit bestimmten Ansprüchen erfolgt eine endgültige Festlegung des Schutzgegenstands (vgl. BGH GRUR 2014, 542 Rn. 23– Kommunikationskanal).

181 Zum anderen handelt es sich bei den von der Klägerin zu1 zitierten Textstellen der Prioritätsschrift nicht um Angaben, die als erfindungswesentlicher Bestandteil der angemeldeten Erfindung charakterisiert wären, sondern diese werden explizit als Ausführungsbeispiele bzw. als an beispielhaft ausgewählten Ausführungsformen experimentell gewonnene Ergebnisse beschrieben (insbesondere Seite 25/39, Abschnitt 12, erster Absatz: „TM TechniquePerformance in VBR EV Codec In this section some examples of the TM technique performance in the VBR EV codec implementation are presented ...”), wobei es sich dabei um eine spezielle Konfiguration der Übergangscodierung handelt (Seite 34/39, letzter Absatz: „Note: This is the most bit-demanding configuration of the TM, i.e. when the glottal-shape codebook is used in the 1st subframe and the pitch period T0 needs to be transmitted for the Q(z) filter construction. This configuration uses in the first subframe a procedure described in section 10.“).

182 Somit handelt es sich bei der nicht-zwingenden Übertragung der Pitchperiode nicht um eine Verallgemeinerung der ursprünglichen technischen Lehre, sondern allenfalls um eine Verallgemeinerung der speziellen und beispielhaften Realisierung in dazu untersuchten Ausführungsbeispielen.

183 Damit stellen sich die in der Voranmeldung anhand von Ausführungsbeispielen beschriebenen Anweisungen für den Fachmann als Ausgestaltung der in der Nachanmeldung umschriebenen allgemeineren technischen Lehre dar und ist diese Lehre in der in der Nachanmeldung offenbarten Allgemeinheit bereits der Voranmeldung als zu der angemeldeten Erfindung gehörend entnehmbar (vgl. BGH, GRUR 2014, 542 Rn. 24 – Kommunikationskanal; BGH GRUR 2022, 1575, Rn. 70 m. w. N.), wodurch diesbezüglich Erfindungsidentität zwischen dem Gegenstand des Prioritätsdokuments und dem Gegenstand des Streitpatents, insbesondere auch in der Fassung nach Hilfsantrags 1, vorliegt. Deshalb ist die Priorität des Streitpatents wirksam in Anspruch genommen und sein Zeitrang der 24. Oktober 2006, wodurch die beiden von der Klägerin zu 1 als „Zwischenliteratur“ in das Verfahren eingeführten, im Prioritätsintervall veröffentlichten Dokumente K20/ITU und K21/Vaillancourt nicht zum Stand der Technik gemäß Art. 54 (2) EPÜ zählen.

4.2

Der Gegenstand des Anspruchs 10 in der Fassung nach Hilfsantrag 1 erweist sich als neu (Art. II § 6 Abs. 1 S. 1 Nr. 1 IntPatÜG i. V. m. Art. 138 Abs. 1 lit. a) i. V. m. Art. 54 EPÜ).

4.2.1

Der Gegenstand des Anspruchs 10 nach Hilfsantrag 1 ist neu gegenüber dem Stand der Technik nach der Druckschrift K10/NK2/Paksoy.

186 Hinsichtlich der Merkmale 10., 10.1 und 10.2 bis 10.4 der Codiereinrichtung des Anspruchs 10, die mit denen des Hauptantrags identisch und aus der Druckschrift K10/NK2/Paksoy bekannt sind, wird auf die entsprechenden Ausführungen zum Hauptantrag in Abschnitt II. 1. verwiesen.

187 Ein zwingendes Erzeugen der Übergangsmodus-Anregung in mindestens einem Rahmen nach einem Übergangsrahmen –d. h. zumindest der unmittelbar auf den Übergang folgende Rahmen in jedem Fall, unabhängig davon um welche Art (stimmlos, stimmhaft, Übergang, etc.) von Rahmen es sich handelt (vgl. Abschnitt III. 1.) –gemäß Merkmal 10.1.1HA1ist der Druckschrift K10/NK2/Paksoy nicht entnehmbar.

188 Auch bei dem von der Klägerin zu 2als Einwand vorgetragenenspeziellen Fall, in dem das ursprüngliche Sprachsignal, das in – direkt oder indirekt – aufeinanderfolgenden Rahmen einen Übergang („Onset“) enthält, und deswegen die adaptive Codebuch-Anregung in diesen beiden Rahmen durch eine Übergangsmodus-Anregung ersetzt wird, handelt es sich nicht um eine Übergangsmodus-Anregungin einem Rahmen, der auf den Übergang in einem Schallsignal folgt. Denn selbst wenn eine Übergangsmodus-Codierung von zwei Rahmen in der von der Klägerin beschriebenen Sequenz erfolgt, bedeutet dies nicht, dass eine Übergangsmodus-Anregungin einem System gemäß Druckschrift K10/NK2/Paksoyinallen Fällen auf den einem Übergang nachfolgenden Rahmen stattfindet.Vielmehr geschieht dies nur, wenn es sich bei diesem wieder um einen Übergangsrahmen handelt, jedoch nicht, wenn es sich dabei um einen beliebigen anderen Rahmen (insbesondere stimmhaften oder stimmlosen Rahmen) handelt, so wie es aber das Merkmal 10.1.1HA1des Anspruchs 10 in der Fassung nach Hilfsantrag 1fordert.

189 Das Ersetzen der adaptiven Codebuch-Anregung durch eine Übergangsmodus-Anregung in zwei aufeinander folgenden Übergangs rahmen, erfüllt nicht notwendigerweise die Forderung des Anspruchs 10 in der Fassung nach Hilfsantrag 1, wonach das Ersetzen der adaptiven Codebuch-Anregung in mindestens einem Rahmen verwendet werden muss, der auf den Übergang in einem Schallsignal folgt.

4.2.2

Der Gegenstand des Anspruchs 10 nach Hilfsantrag 1 ist neu gegenüber dem Stand der Technik nach der Druckschrift K9/NK3/Da Silva.

191 Der Artikel K9/NK3/Da Silva beschäftigt sich mit dem Problem, dass die Verwendung von CELP-basierten Verfahren in Codiereinrichtungen mit niedrigen Bitraten zur schlechten Rekonstruktion von stimmhaften Einsätzen („voiced onsets“) führt. Er beschreibt einen 4 kbit/s CELP-Algorithmus, der diesen kritischen Sprachsegmenten Priorität einräumt und verschiedene Kombinationen von Codebüchern und Bit-Zuweisungen für verschiedene Sprachklassen verwendet. Dieser Codier-Algorithmus wird als CELP-PCS (kurz für: „CELP with priority to critical segments“) bezeichnet und basiert auf der Idee des sogenannten PS-VXC-Schemas (kurz für: „Phonetically-Segmented Vector Excitation Coding“) (Abstract und Abschnitt „1 Introduction“).

192 Dabei wird nicht nur wie üblich der Übergang von einem stimmlosen zu einem stimmhaften Segment, sondern auch der Übergang von einem stimmhaften Segment auf ein anderes stimmhaftes Segment als stimmhafter Einsatz („voiced onset”) bzw. „kritisches Sprachsegment“ („critical segment”) bezeichnet (auf Seite 1, Spalten übergreifender Absatz).

193 Aus der DruckschriftK9/NK3/Da Silva ist in Worten des erteilten Anspruchs 10 ausgedrückt Folgendes bekannt: Eine

194 10. Codiereinrichtung

195 (Abstract: „In this paper we describe a 4 kbit/s CELP algorithm“ und Abschnitt „3 CELP-PCS CODER CONFIGURATION“ und Abschnitt„3.1 General Description“, erster Satz: „Figure 1 depicts the block diagram of the CELP-PCS coding configuration.“)

196 10.1 zum Erzeugen einer Übergangsmodus-Anregung, die eine adaptive Codebuch-Anregung ersetzt

197 (K9/NK3/Da Silva erweitert die bekannte PS-VXC-Technik eines CELP-Codecs, die Sprachsegmente als stimmhaft, stimmlos und stimmhafte Einsätze („voiced onsets“) klassifiziert. Aufgrund ihrer Bedeutung für die Wahrnehmung werden Sprachsegmente, die zur Klasse der stimmlosen-zu-stimmhaften und stimmhaften-zu-stimmhaften Übergängen gehören, als kritische Segmente („critical Segments“,„CR“) und der vorgeschlagene Codier-Algorithmus als CELP-PCS („CELP with priority to critical segments“) bezeichnet.

198 Das Codebuch, aus dem die Anregungen je nach Kategorisierung entnommen werden, wird aus einem von sechs verschiedenen Codebüchern ausgewählt: eine madaptiven Codebuch und fünf verschiedenen festen Codebüchern mit den Bezeichnungen VO, VO-VO, UV-VO-1, UV-VO-2 und UV (Seite 2, linke Spalte, fünfter Absatz: „As shown in Fig. 1, six codebooks are considered for the excitation modeling: one adaptive and five fixed (VO, VO-VO, UV-VO-1, UV-VO-2 and UV). The adaptive codebook uses fractional delays and the fixed codebooks are obtained according to a multipulse stochastic codebook design recently proposed in the literature …“). Für die kritischen Segmente („CR“), also Übergänge von stimmlos zu stimmhaft „UV-VO“ (für „unvoiced“ nach „voiced“) und von stimmhaft zu stimmhaft „VO-VO“ (für „voiced“ nach „voiced“), werden jeweils zwischen verschiedenen Codier- bzw. Anregungsmodi aus einem bzw. zwei der oben genannten sechs Codebücher ausgewählt, um die Anregung für das zu codierende Signal zu generieren (Seite 1, rechte Spalte, letzter Absatz: „For each speech sub-block the encoder selects one or two of these six codebooks to be the generating source of the signal excitation.“). Da kritische Segmente Übergangssprachsegmente ohne Langzeitkorrelation sind, für die das adaptive Codebuch ungeeignet ist, wird es bei diesen nicht aktiviert und stattdessen eine Kombination aus UV-VO-Codebüchern verwendet (Seite 1, rechte Spalte, vierter Absatz: „At low bit rates, the CELP algorithm is particularly inefficient in the reproduction of voiced onsets. This is because during these segments of speech the long-term correlation with past samples is low or even null. Consequently, the adaptive codebook performs poorly.“ und Seite 2, rechte Spalte, dritter Absatz: „Critical segments of the unvoiced-voiced type do not exhibit any significant long-term correlation. For this reason the adaptive codebook is not activated. These segments employ two codebooks: UV-VO-1 containing 256 vectors and UV-VO-2 with 128 vectors“).

199 Diese Verwendung der UV-VO-Codebücher statt des adaptiven Codebuchs für den Übergang von stimmloser zu stimmhafter Sprache – und damit das Ersetzen der adaptiven Codebuch-Anregung durch eine Übergangsmodus-Anregung – wird im Blockschaltbild der Figur 1 durch den rot eingekreisten Schalter dargestellt, der zwischen dem „Adaptive Codebook / VO-Codebook / VO-VO-Codebook“ einerseits (obere Schalterstellung) und den Übergangscodebüchern „UV-VO-1 / UV-VO-2“ andererseits (mittlere Schalterstellung) umschaltet und damit nur den einen oder den anderen Beitrag in die Anregung einleitet.)

200 10.2 einem Erzeuger eines Codebuch-Suchzielsignals,

201 (Dem Codebuch-Suchzielsignal im Streitpatent entspricht in K9/NK3/Da Silva das Referenzsignal s(n), aus dem durch Differenzbildung mit dem aus den verwendeten Codebüchern gebildeten Anregungssignal

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

(n) der Restfehler ew(n) bestimmt und anschließend minimiert wird, wie im unteren rechten Teil der Figur 1 schematisch dargestellt ist. Dabei ist es für den Fachmann selbstverständlich, dass das Codebuch-Suchzielsignal s(n) vorher durch einen – in der Sprache des Streitpatents– „Erzeuger“, wie bei CELP-Codecs üblich, bereitgestellt und ggf.durch verschiedene Komponenten wie Filter in ein geeignetes Format gebracht wird.)

202 10.3 einem Übergangsmodus-Codebuch zum Erzeugen eines Satzes von Codevektoren unabhängig von einer früheren Anregung,

203 10.3.1 wobei die Codevektoren des Satzes jeweils zu einer entsprechenden Übergangsmodus-Anregung gehören und

204 (Die Übergangsmodus-Codebücher nach K9/NK3/Da Silva enthalten, wie jedes Codebuch eines fachüblichen CELP-Codierers, mehrere verschiedene Folgen von Anregungswerten, die sog.Sätze von Codevektoren. Diese werden nicht durch eine Signalrückführung des durch die Codebücher gebildeten Anregungssignals wie beim adaptiven Codebuch erzeugt (vgl. den ins adaptive Codebuch zurückweisenden Signalpfad in Figur 1), sondern sind unabhängig von früheren Anregungen, da es sich dabei um sogenannte feste „fixed“ Codebücher handelt (Seite 2, linke Spalte, fünfter Absatz: „As shown in Fig. 1, six codebooks are considered for the excitation modeling: one adaptive and five fixed (VO, VO-VO, UV-VO-1, UV-VO-2 and UV).“). Die durch Codebuchsuche für einen bestimmten Übergangsrahmen gefundenen Codevektoren aus den Übergangsmodus-Codebüchern liefern das jeweilige Anregungssignal und gehören somit jeweils zu einer entsprechenden Übergangsmodus-Anregung.)

205 10.4 einer Sucheinrichtung des Übergangsmodus-Codebuchs zum Auffinden des Codevektors des Satzes, der zu einer Übergangsmodus-Anregung gehört, die dem Codebuch-Suchzielsignal optimal entspricht.

206 (Die im unteren rechten Teil der Figur 1 schematisch dargestellte Anordnung ermittelt durch Differenzbildung den Restfehler ew(n) aus dem von den jeweils verwendeten Codebüchern gebildeten Anregungssignal

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

(n) und dem Codebuch-Suchzielsignal s(n), der anschließend durch die „Error Minimization“-Einheit minimiert wird. Somit realisiert diese Anordnung eine Sucheinrichtung für alle und damit auch für die Übergangsmodus-Codebücher, die dazu dient, denjenigen zu einer Übergangsmodus-Anregung gehörenden Codevektor aufzufinden, der dem Codebuch-Suchzielsignal optimal entspricht.)

207 Nicht offenbart ist in der Druckschrift K9/NK3/Da Silva zum einen das Merkmal 10.1.1HA1, wonach eine adaptive Codebuch-Anregung in mindestens einem Rahmen, der auf einen Übergangsrahmen in einem Schallsignal folgt, durch eine Übergangsmodus-Anregung ersetzt wird.Zum anderen ist auch das Merkmal 10.3.2, wonach das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen aufweist, der Druckschrift K9/NK3/Da Silva nicht unmittelbar und eindeutig entnehmbar.

208 Auch die von der Klägerin zu 1 hierzu als Einwand vorgetragene spezielle Sprachsequenz – von den Parteien als „Überschwappfall“bezeichnet – bei der zwei Unterrahmen ein kritisches Segment – d. h. einen Übergang im Sinne des Streitpatents– bilden, in zwei aufeinanderfolgenden Rahmen liegen und im Übergangsmodus codiert werden, offenbart keine Ersetzung einer adaptiven Codebuch-Anregung in mindestens einem Rahmen, der auf einen Übergangsrahmen folgt, wie in Merkmal 10.3.2 gefordert.

209 Zwar trifft es zu, dass es sich bei der Codiereinrichtung gemäß K9/NK3/Da Silva bei bestimmten zu codierenden Sprachsequenzen ergeben kann, dass ein als sogenanntes kritisches Segment bezeichneter Übergang zwei aufeinanderfolgende Unterrahmen umfasst, so dass bei einem Überlappen von einem Rahmen auf den nächsten neben dem ersten Übergangsrahmen (d. h. dem Rahmen mit dem ersten Teil des Übergangs) auch der darauffolgende Rahmen (d. h. der Rahmen, der den zweiten Teil des Übergangs enthält) mit dem glottalen Übergangsmodus-Codebuch von K9/Da Silva codiert wird.

210 Jedoch kann die Ersetzung einer adaptiven Codebuch-Anregung durch eine Übergangsmodus-Anregung bei einer derartigen bestimmten Sprachsequenz die Forderung des Merkmals 10.1.1HA1 schon deswegen nicht erfüllen, da sie nur in einem sich zufällig ergebenden Fall eintritt und nicht allgemein zwingend für jeden vorausgehenden Übergangsrahmen, d. h. bei beliebigen Klassen der dem Übergangsrahmen folgenden Rahmen. Denn konkret wird im genannten „Überschwappfall“ die adaptive Codebuch-Anregung in einem Rahmen (n+1), der auf einen Übergangsrahmen (n) in einem Schallsignal folgt, durch eine Übergangsmodus-Anregung unter Verwendung der „Übergangsmodus-Codebücher“ UV-VO-1 und UV-VO-2 ersetzt, da die beiden aufeinander folgenden Rahmen (n und n+1)jeweils selbst Übergangsrahmen darstellen. Der dritte Rahmen (n+2), der somit den ersten Rahmen repräsentiert, der auf den Übergang in einem Schallsignal folgt, jedoch nicht, es sei denn, es handelt sich dabei wiederum um einen Übergangsrahmen (ad infinitum). Ein Rahmen, der auf den Übergang in einem Schallsignal folgt und selbst kein Übergangsrahmen ist, wird somit auch beim „Überschwappfall“ in K9/NK3/Da Silva nicht übergangscodiert.

211 Denn die Verwendung der Übergangsmodus-Anregung in zwei aufeinanderfolgende Rahmen ist nicht gleichbedeutend mit der Übergangsmodus-Anregung in einem Rahmen, der auf einen Übergangsrahmen in einem Schallsignal folgt, wie es von Merkmal 10.1.1HA1 gefordert wird.

212 Auch der Vorwegnahme des Merkmals 10.3.2durch die Druckschrift K9/NK3/Da Silva, wofür die Klägerin zu 1 unter Verweis auf die FachbücherK5´/Vary und K23/Kondoz argumentiert, kann der Senat aus den folgenden Gründen nichtfolgen:

213 Die als Übergangsmodus-Codebuch verwendeten Codebücher UV-VO-1 und UV-VO-2 in K9/NK3/Da Silva werden als Codebücher beschrieben, welche bei den als kritische Unterblöcke („CR“) bezeichneten Anlauten („segments of the unvoiced-voiced“, „UV-VO“)das adaptive Codebuch ersetzen und damit eine möglichst gute Annäherung an das LPC-Residuum für die Codierung gewährleisten. Sie erfüllen somit die funktionell definierte Vorgabe für das Übergangsmodus-Codebuch von glottalen Impulsformen, da sie in der Lage sind, den quasi-periodischen Anteil der Anregungen, den für glottale Laute charakteristischen Stimmeinsatz, der ansonsten durch das adaptive Codebuch modelliert wird, zu erzeugen.

214 Die Codevektoren des UV-VO-Codebuchs werden – wie bei allen festen Codebüchern der Codiereinrichtung von K9/NK3/Da Silva – durch ein sogenanntes „multipulse stochastic codebook“ in einem iterativen, auf einer Sprachdatenbank basierenden, Trainingsverfahren mittels eines dem Fachmann bekannten LBG-Algorithmus als spärlich besetzte Codebücher mit der Dimension 48 und acht von Null verschiedenen Elementen erzeugt.

215 Zwar ist diese Art der Codevektorerzeugung ähnlich der des Streitpatents, welches dazu ebenfalls ein Trainingsverfahren, basierend auf dem sog. k-means-Algorithmus verwendet (Absatz 0081). Dass diese Gemeinsamkeit jedoch tatsächlich zwingend dazu führt, dass die Codevektoren des UV-VO-Codebuchs die erfindungsgemäßen glottalen Impulsformen (vgl. Auslegung in Abschnitt I. 3.2.4) aufweisen, kann nach Erkenntnis des Senats zumindest nicht als unmittelbar und eindeutig offenbart gelten.

4.2.3

Der Gegenstand des Anspruchs 10 nach Hilfsantrag 1 ist neu gegenüber dem Stand der Technik nach der Druckschrift NK6/Shlomot.

217 Diese in der mündlichen Verhandlung von den Klägerinnen nicht mehr aufgegriffene Druckschrift stellt ein hybrides Sprachcodierungsverfahren vor, das einen parametrischen Codierer im Frequenzbereich für stationäre stimmhafte und stimmlose Sprache („stationary voiced and stationary unvoiced speech“) mit einem Wellenformcodierer im Zeitbereich für Übergangssprache („transition speech“) kombiniert (Abstract, Satz 1). Statt eines Zwei-Klassen-Modells („traditional two-class voiced/unvoiced model“) wird ein Drei-Klassen-Modell („three-class voiced/unvoiced/transition model“) verwendet, welches in der Lage ist, eine hohe Qualität für Sprache bei Übergängen bereitzustellen (Seite 636, rechte Spalte, „B. General Structure of a Hybrid Speech Coder“, erster Absatz). Figur 4 zeigt eine schematische Darstellung einer derartigen Hybrid-Codiereinrichtung.

Abbildung

Abbildung

Quelle: www.rechtsprechung-im-internet.de

218 Aus der Druckschrift NK6/Shlomot(insbesondere Abschnitte III. C.: „Modeling and Coding of Transition Speech“ und VI. D.: „Coding of Transition Signal“)ist, in Worten des erteilten Anspruchs 10 ausgedrückt, Folgendes bekannt: Eine

219 10. Codiereinrichtung

220 (Titel: „Hybrid Coding“, Abstract: „A new hybrid speech coding technique”und Figur 4: „hybrid encoder“)

221 10.1 zum Erzeugen einer Übergangsmodus-Anregung, die eine adaptive Codebuch-Anregung ersetzt,

222 (Der Übergang („transition“) ist nach NK6/Shlomot ein Segment eines Sprachsignals, welches vom Sprachklassifizierer („Classifier“) weder als stimmhaft („voiced“) noch als stationär stimmlos („steady unvoiced“) bestimmt wird und somit weder von dem harmonischen Codiermodus („Harmonic Coder“) noch von dem rauschartigen Codiermodus („Stationary Unvoiced Coder“), oder einer Kombination davon codiert werden kann, beispielsweise Anlaute, Plosive und nicht periodische glottale Impulse (Figur 4 i. V. m. Seite 633, linke Spalte, 1. Absatz: „However, the transition segments, such as onsets, plosives, and nonperiodic glottal pulses, consist of local time events that cannot be represented by the harmonic or the noise models (or even a combination of both).”)

223 Wie im Abschnitt “C. Modeling and Coding of Transition Speech" auf Seite 637 ausgeführt, erfolgt die Anregung dabei im Übergangsmodus („Transition Coder“). Denn da bei Übergängen keine starke Periodizitätsstruktur vorhanden ist, wird der Beitrag des sonst üblichen adaptiven Codebuches nicht verwendet, d. h. dieses wird ersetzt (Seite 637, Abschnitt III. C., 1. Absatz: „Since transition segments do not have a strong periodicity structure, we did not incorporate the “adaptive codebook” contribution, common in CELP type coders.”).)

224 10.2 einem Erzeuger eines Codebuch-Suchzielsignals,

225 (Als Codebuch-Suchzielsignal bei der CELP-üblichen Analyse-durch-Synthese wird die wahrnehmungsgewichtete Sprache verwendet, die zwangsläufig zuvor „erzeugt“ werden muss (Seite 644, linke Spalte, 1. Absatz: “The best track and the optimal pulse positions are found by a full search analysis-by-synthesis scheme with the perceptually weighted speech as a target signal.”))

226 10.3 einem Übergangsmodus-Codebuch zum Erzeugen eines Satzes von Codevektoren unabhängig von einer früheren Anregung,

227 10.3.1 wobei die Codevektoren des Satzes jeweils zu einer entsprechenden Übergangsmodus-Anregung gehören und

228 (Die Übergangsanregungen werden dabei durch, ggf. mit einem individuellen Skalierungsfaktor („gain“) multiplizierten, aber festgelegten Impulsen, insbesondere eines algebraischen Codebuches, generiert. Somit sind die einzelnen Codevektoren des Übergangscodebuchs auch grundsätzlich unabhängig von vorangegangen Anregungen (vgl. Seite 637, linke Spalte, vorletzter Absatz bis Seite 637, rechte Spalte, 1. Absatz).)

229 10.4 einer Sucheinrichtung des Übergangsmodus-Codebuchs zum Auffinden des Codevektors des Satzes, der zu einer Übergangsmodus-Anregung gehört, die dem Codebuch-Suchzielsignal optimal entspricht.

230 (Seite 644, linke Spalte, 1. Absatz: “The best track and the optimal pulse positions are found by a full search analysis-by-synthesis scheme with the perceptually weighted speech as a target signal.”.Somit realisiert diese Anordnung eine Sucheinrichtung für alle und damit auch für das Übergangsmodus-Codebuch, die dazu dient, denjenigen zu einer Übergangsmodus-Anregung gehörenden Codevektor aufzufinden, der dem Codebuch-Suchzielsignal optimal entspricht.)

231 Nicht offenbart ist in der Druckschrift NK6/Shlomotdas Merkmal 10.1.1HA1, wonach eine adaptive Codebuch-Anregung in mindestens einem Rahmen, der auf einen Übergangsrahmen in einem Schallsignal folgt durch eine Übergangsmodus-Anregung ersetzt wird.

232 Insbesondere zeigt auch die von der Klägerin zu 2 zitierte Textstelle Seite 637, rechte Spalte, vorletzter Absatz: „Fig. 6(a) shows the original residual for an 80 ms onset segment that consists of eight 10 ms subframes. The first four subframes are transition and the last four subframes are harmonic.“mit Seite 637, linke Spalte, zweiter Absatz: „The term “subframe” will be used in the sequel to describe the first or the second 10 ms segment within each 20 ms frame.“ lediglich, dass das Impulsanregungsmodell, d. h. dasÜbergangsmodus-Codebuch, dazu verwendet wird, eine Anregung zur Codierung des Übergangs-Sprachabschnitts und der darin enthaltenen Übergangs-Unterrahmen selbst zu erzeugen (Seite 637, rechte Spalte, vorletzter Absatz: „The pulse-excitation model was used for the transition subframes, and the harmonic model was used for the harmonic subframes.).Eine Übergangsmodus-Anregung unter Verwendung des Übergangsmodus-Codebuchs in einem Rahmen nach einem Übergangsrahmen im Sinne des Merkmal 10.1.1HA1 ist der Druckschrift NK6/Shlomot nicht zu entnehmen.

233 Ebenfalls nicht entnehmbar ist der Druckschrift NK6/Shlomotdas Merkmal10.3.2, wonach das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen aufweist.

234 Wie insbesondere in Seite 637, Abschnitt III. C.:„C. Modeling and Coding of Transition Speech” beschrieben wird, kann als Übergangsmodus-Codebuch prinzipiell eine Drei-, Fünf- oder Zehn-Puls-Anregung eingesetzt werden, wobei sich gegenüber einer Dreipuls-Anregung mit Unterrahmen-individueller Amplitude („three pulses with individual gains can be used for each subframe … „multipulse“) und einer Zehn-Puls-Anregung mit verschiedenem Vorzeichen und konstanter Verstärkung („individual sign for each pulse and a single gain for all pulses … “algebraic codebook” “) für die Übergangscodierung ein algebraisches Codebuch mit Fünfpuls-Anregung („five-pulse algebraic codebook“) die jeweils lediglich fünf Einheitsimpulse mit individuellem Vorzeichen und einheitlichem Verstärkungsfaktor für alle Pulse (+1 und -1) enthalten (Seite 643, Abschnitt VI. D.), am geeignetsten erwiesen hat. Unterschiedliche glottale Impulsformen im Sinne des Streitpatents, wie sie vom Merkmal 10.3.2des Anspruchs 10 gefordert werden, sind jedoch keiner der verschiedenen Varianten der Codiereinrichtung gemäß NK6/Shlomot entnehmbar.

4.2.4

Der Gegenstand des Anspruchs 10 nach Hilfsantrag 1 ist neu gegenüber dem Stand der Technik nach der Druckschrift NK5/Microsoft.

236 Die internationale Patentanmeldung NK5/Microsoft(= WO 2006/130229 A1), wurde nach dem Prioritätstag des Streitpatents (24. Oktober 2006) am 7. Dezember 2006 veröffentlicht, weist mit dem 31. Mai 2005 eine frühere Priorität als das Streitpatent auf und ist damit als Stand der Technik nach Art. 54 Abs. 3 EPÜ nur für die Frage der Neuheit zu berücksichtigen.

237 Allgemein betrifft NK5/Microsoft verschiedene Audio-Codierungstechniken für codebuchbasierte, insbesondere CELP-Codecs, die mehrere Stufen von festen Codebüchern umfassen, einschließlich Impuls- und/oder Zufallscodebüchern, deren Anzahl variiert werden kann, um die Qualität bei einer bestimmten Bitrate zu maximieren. Zusätzlich kann ein adaptives Codebuch ein- oder ausgeschaltet werden, abhängig von Faktoren wie der erwünschten Bitrate und den Eigenschaften des aktuellen Rahmens oder Unterrahmens (Seite 7, Zeilen 10 bis 21).

238 Nicht entnehmbar ist der Druckschrift NK5/Microsoft das Merkmal 10.3.2, wonach das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen aufweist.

239 Zwar verwendet das Pulscodebuch, das als festes Übergangsmodus-Codebuch die adaptive Codebuch-Anregung ersetzt, sog. Einheitspulse (Seite 19, Zeilen 7 bis 11: „A pulse codebook is a type of fixed codebook that specifies one or more pulses to be contributed to the excitation signal. The pulse codebook parameters include pairs of indices and signs (gains can be positive or negative). Each pair indicates a pulse to be included in the excitation signal, with the index indicating the position of the pulse, and the sign indicating the polarity of the pulse.“), die nach Absatz 0079 des Streitpatents als die einfachste, wenn auch nur begrenzt leistungsfähige Form von glottalen Impulsen zu werten sind. Jedoch ist bei der Codiereinrichtung nach NK5/Microsoft keine weitere Impulsform offenbart, so dass die von Merkmal 10.3.2 geforderte Mehrzahl von „glottal impulse shapes” nicht verwirklicht ist, vgl. dazu die Auslegung in Abschnitt I. 3.2.4.

240 Dass die Codevektoren des Pulscodebuchs der Codiereinrichtung nach NK5/Microsoft andere Impulsformen als Einheitspulse enthalten würden, wurde auch von den Klägerinnen nicht vorgetragen.

241 Ob aus der Druckschrift NK5/Microsoft das Merkmal 10.1.1HA1, wonach eine Übergangsmodus-Anregungeine adaptive Codebuch-Anregung in mindestens einem Rahmen, der auf einen den Übergangsrahmen in einem Schallsignal folgt, ersetzt, kann dahinstehen, da jedenfalls das Merkmal 10.3.2nicht offenbart ist.

4.2.5

Der Gegenstand des Anspruchs 10 nach Hilfsantrag 1 ist neu gegenüber dem weiter abliegenden Stand der Technik nach den übrigen im Verfahren befindlichen Druckschriften.Die Neuheitsschädlichkeit weiterer Entgegenhaltungen wurde von den Klägerinnen weder schriftsätzlich noch in der mündlichen Verhandlung geltend gemacht und ist auch für den Senat nicht ersichtlich.

4.3

Der Gegenstand des Anspruchs 10 in der Fassung nach Hilfsantrag 1 erweist sich auch als auf einer erfinderischen Tätigkeit beruhend (Art. II § 6 Abs. 1 S. 1 Nr. 1 IntPatÜG i. V. m. Art. 138 Abs. 1 lit. a), Art. 56 EPÜ).

4.3.1

Ausgehend vom nächstliegenden Stand der Technik nach der DruckschriftK10/NK2/Paksoy gelangt der Fachmann nicht in naheliegender Weise zum Gegenstand des Anspruchs 10nach Hilfsantrag 1.

245 Die Codiereinrichtung der Druckschrift K10/NK2/Paksoyzeigt alle Merkmale der Codiereinrichtung des Anspruchs 10nach Hilfsantrag 1 (vgl. Abschnitt II. 1.1) bis auf das gegenüber dem Hauptantrag geänderteMerkmal10.1.1HA1, wonach eine Übergangsmodus-Anregung zwingend in mindestens einen Rahmen direkt nach einem Übergangsrahmen eine adaptive Codebuch-Anregung ersetzt. Dieses Merkmal ist für den Fachmann jedoch auch nicht ohne erfinderisches Zutun – weder unter Berücksichtigung des Wissens und Könnens, noch in Kombination mit einer oder mehreren der anderen im Verfahren befindlichen Druckschriften – realisierbargewesen.

a)

Zwar weiß der Fachmann aufgrund seines Fachwissens oder seiner praktischen Erfahrung, dass sich nach Übertragungsfehlern, insbesondere im Fall von verlorenen Einsatzrahmen wegen der Desynchronisierung von Codierer und Decodierer, die Auswirkung nicht auf den gelöschten Rahmen beschränkt.Diesen, prädiktiven Codecs inhärenten, Nachteil kann der Fachmann beispielsweise auch der technischen Lehre der Druckschrift K10/NK2/Paksoyentnehmen (Seite 63, rechte Spalte, 1. Absatz, letzte beiden Sätze: „Furthermore, if the coding of the onset excitation fails, the adaptive codebook search performed in subsequent subframes will also have difficulty generating a good approximation of the periodic part of the LPC excitation. Consequently, poor coding of the onset will degrade the quality of the synthesized speech for several subframes.“).

247 Der Annahme, dass der Fachmann dies berücksichtigend bereits ohne Anregungen aus anderen Dokumenten zur Verbesserung die adaptive Codebuch-Anregung nicht nur im Übergangsrahmen, sondern auch im jeweils(direkt) nachfolgenden Rahmen durch eine Übergangsmodus-Anregung ersetzen und somit zu der Erfindung gelangen könnte, steht jedoch zum einen entgegen, dass in K10/NK2/Paksoynach einer entsprechenden fehlerhaften Codierung eines Einsatzrahmens explizit lediglich von einer Qualitätsverminderung in einigen folgenden Unterrahmen die Rede ist („subsequent subframes … several subframes.“). Eine hypothetische zeitliche Ausdehnung der Übergangsmodus-Anregung auf einen nachfolgenden Rahmen ist dadurch nicht zwingend impliziert.

248 Zum anderen bedeutet die reine Möglichkeit oder das Fehlen von Hinderungsgründen, von im Stand der Technik Bekannten zu der erfindungsgemäßen Lösung zu gelangen, nicht, dass der Fachmann auch tatsächlich dahin gelangt wäre; die Bewertung, dass das Auffinden einer neuen Lehre zum technischen Handeln nicht auf einer erfinderischen Tätigkeit beruht, setzt vielmehr voraus, dass das Bekannte dem Fachmann Anlass oder Anregung gab, zu der vorgeschlagenen Lehre zu gelangen (vgl. BGH GRUR 2010, 407, Rn. 17 – einteilige Öse; BGH, Urteil vom 21. Juli 2022, X ZR 82/20 – Leuchtiode, juris Rn. 94). Eine Veranlassung, ausgehend von der reinen Beschreibung des Nachteils in K10/NK2/Paksoydie erfindungsgemäße Lösung des Ersetzens der adaptiven Codebuch-Anregung durch eine Übergangsmodus-Anregung auch in dem, dem Übergang nachfolgenden Rahmen zu realisieren, kann der Fachmann Paksoy aber nicht entnehmen. Vielmehr führt die in sich abgeschlossene Lehre den Fachmann von der Lehre des Streitpatents weg, indem sie, unmittelbar auf die zitierte Textstelle folgend, ein anderes offensichtlich ausreichendes Lösungskonzept für dieses Problem offenbart (Seite 63, rechte Spalte, 1. Absatz, letzte beiden Sätze: „VRPS provides a remedy for this situation …”).

b)

Es ist bereits fraglich, ob der Fachmann, der ausgehend von der Druckschrift K10/NK2/Paksoydie Verbesserung stimmloser Sprachsignale verfolgt, die Druckschrift NK11/Stachurskiin seine Überlegungen einbeziehen würde, wie die Klägerin zu 2 meint.

250 Die Druckschrift NK11/Stachurski beschreibt eine multimodale Quantisierung des Prädiktionsfehlers in einem Sprachkodierer vom MELP-Typ. Bei MELP (M ixed- E xcitation L inear P rediction) handelt es sich um ein auf Vocoder-Technik basierendes verlustbehaftetes Komprimierungsverfahren für lediglich menschliche Sprache bei extrem niedrigen Bitraten mittels einer Codierung im Frequenzbereich. Doch selbst wenn der Fachmann ungeachtet der prinzipiellen Unterschiede der Codierungstechniken von NK11/Stachurski diese berücksichtigen würde, hätte er deren technische Lehre nicht ohne weiteres auf die der K10/NK2/Paksoy übertragen können:

251 Denn selbst wenn er ausgehend von K10/NK2/Paksoy die Wechsel von der Zeit- in die Frequenzdomäne ignorieren und die sog.schwachen und starken Prädiktoren mit festen und adaptiven Codebüchern gleichsetzen würde, ist es weiterhin fraglich, ob er trotz der beschriebenen Anwendung der Prädiktoren nur für stimmhafte Rahmen bzw. der Möglichkeit, auch stimmhafte Signale schwach prädiktiv zu codieren, die Anwendung von schwachen Prädiktoren für stimmlose Rahmen und starken Prädiktoren für stimmhafte Rahmen realisieren würde, da eine Verwendung bestimmter Codebücher für bestimmte klassifizierte Rahmen in NK11/Stachurski nicht vorgesehen ist (vgl. z. B. Absatz 0027).

252 Vor allem werden in NK11/Stachurski keine Übergangsrahmen – weder als Übergang von stimmlosen zu stimmhaften Rahmen, noch von stimmhaften zu stimmhaften Rahmen – thematisiert. Den Übergang von schwachen zu starken Prädiktoren mit Übergangsrahmen zu identifizieren und den mindestens einen darauf folgenden Rahmen im Sinne des Merkmals 10.1.1HA1mit Übergangsmodus-Anregung codieren, würde sich zur Überzeugung des Senats nicht ohne eine unzulässige rückschauende Betrachtungsweise in Kenntnis der Erfindung ergeben.

c)

Der von der Klägerin zu 1 zur Kombination mit K10/NK2/Paksoyschriftsätzlich herangezogene Fachartikel K17/Montminy beschäftigt sich mit den Effekten von Paketverlusten in einem CELP-Codec und schlägt einen Ansatz zu deren Verminderung vor („recovery by re-initialization (RbR)“, Seite 434, rechte Spalte, vorletzter Absatz bis Seite 435, linke Spalte, Absatz 2). Dabei wird das adaptive Codebuch periodisch re-initialisiert, indem dessen Inhalt auf Null gesetzt wird und die Codierung im betreffenden Rahmen allein durch das feste Codebuch erfolgt. Zur Verringerung der Folgen eines Verlusts des Re-Initialisierungsrahmens schlägt K17/Montminy vor, mit dem nächsten und übernächsten zu sendenden Rahmen auch den Index des festen Codebuchvektors und die Gewichtung des vorausgehenden Rahmens zu übertragen.

254 Der Senat kann nicht erkennen, wie diese aus K17/Montminy vorgeschlagene Methode den Fachmann bei der Codiereinrichtung der Druckschrift K10/NK2/Paksoydazu anregen sollte, die Erzeugung der Übergangsmodus-Anregung in mindestens einen Rahmen nach einem Übergangsrahmen statt in zwei aufeinanderfolgenden Unterrahmen des Übergangsrahmens vorzunehmen. Vielmehr würde er bei Berücksichtigung von Montminy zur Überzeugung des Senats allenfalls derart von der technischen Lehre von der Druckschrift K10/NK2/Paksoyabweichen, indem er das adaptive Codebuch periodisch re-initialisieren,stattdessen Anregung für bestimmte Rahmen ersetzen würde.

d)

Weitere Kombinationen der Druckschrift K10/NK2/Paksoymit anderem im Verfahren befindlichen Stand der Technik wurde von den Klägerinnen weder schriftsätzlich noch in der mündlichen Verhandlung behandelt.

256 Insgesamt ist deshalb nicht ersichtlich, wie ein Fachmann ausgehend von dem in Druckschrift K10/NK2/Paksoybeschriebenen CELP-Modell in naheliegender Weise zum Gegenstand des Patentanspruchs 10 nach Hilfsantrag 1 gelangen sollte.

4.3.2

Auch ausgehend vom Stand der Technik nach der DruckschriftK9/NK3/Da Silva gelangt der Fachmann nicht in naheliegender Weise zum Gegenstand des Anspruchs 10nach Hilfsantrag 1.

258 Wie zur Neuheit des Gegenstands des Patentanspruchs 10 nach Hilfsantrag 1 in Abschnitt III. 4.2.2 dargelegt, weist die aus der Druckschrift K9/NK3/Da Silva bekannte Codiereinrichtung zum einen das Merkmal 10.1.1HA1 nicht auf, wonach eine adaptive Codebuch-Anregung in mindestens einem Rahmen, der auf einen Übergangsrahmen in einem Schallsignal folgt, durch eine Übergangsmodus-Anregung ersetzt wird. Zum anderen ist das Merkmal 10.3.2, wonach das Übergangsmodus-Codebuch ein Codebuch von glottalen Impulsformen aufweist, der Druckschrift K9/NK3/Da Silva nicht unmittelbar und eindeutig entnehmbar.

a)

Zwar mag der Fachmann vor dem Hintergrund seines präsenten Fachwissens ausgehend von dem CELP-basierten Verfahren bei niedrigen Bitraten zur Rekonstruktion von Einsätzen („voiced onsets“) nach K9/NK3/Da Silva mit dem dort beschriebeneniterativen, auf einer Sprachdatenbank basierenden Trainingsverfahren mittels LBG-Algorithmus für die Codevektoren des Codebuchs „UV-VO-1“ ein erfindungsgemäßesÜbergangsmodus-Codebuch gemäß der streitpatentgemäßen technische Lehre mit mehreren glottalen Impulsformen realisieren können, ohne erfinderisch tätig werden zu müssen. Während somit das Merkmal 10.3.2für den Fachmann noch nahegelegt sein mag, ist dies für das fehlende Merkmal 10.1.1HA1nicht der Fall.

260 Auch durch die Verwendung der Übergangsmodus-Anregung in zwei aufeinanderfolgenden Rahmen unter dem Stichwort des „Überschwappfalls“ – wonach es sich bei der Codiereinrichtung gemäß K9/NK3/Da Silva bei bestimmten zu codierenden Sprachsequenzen ergeben kann, dass ein als sog. kritisches Segment bezeichneter Übergang zwei aufeinanderfolgende Unterrahmen umfasst – sodass bei einem Überlappen von einem Rahmen auf den nächsten neben dem ersten Übergangsrahmen (mit dem ersten Teil des Übergangs) auch der darauffolgende Rahmen (mit dem zweiten Teil des Übergangs) mit dem glottalen Übergangsmodus-Codebuch von K9/NK3/Da Silva codiert wird, erhält der Fachmann keinerlei Hinweis oder Anregung für dieÜbergangsmodus-Anregungallgemein in jedem Rahmen, der (direkt) auf einen Übergangsrahmen in einem Schallsignal folgt, wie es von Merkmal 10.1.1HA1 gefordert wird. Auch der übrigen technischen Lehre ist keinerlei diesbezüglicher Hinweis zu entnehmen(vgl. dazu auch die Ausführungen im Rahmen der Neuheitsbetrachtung in Abschnitt III. 4.2.2).

b)

Bezüglich einer möglichen Zusammenschau ausgehend von der Druckschrift K9/NK3/Da Silva mit anderem im Verfahren befindlichen Stand der Technik gilt das Gleiche wie für die Kombination der K10/NK2/Paksoy mit diesen Druckschriften (Abschnitt III. 4.3.1):

262 Für die Berücksichtigung der Druckschrift NK11/Stachurski hat der Fachmann bereits keine Veranlassung, der Fachartikel K17/Montminy gibt dem Fachmann keine Anregung zur Realisierung des fehlenden Merkmals10.1.1HA1und weitere Kombinationen der Druckschrift K9/NK3/Da Silva mit anderem im Verfahren befindlichen Stand der Technik wurden selbst von den Klägerinnen weder schriftsätzlich noch in der mündlichen Verhandlung vorgetragen.

263 Insgesamt ist deshalb nicht zu erkennen, wie ein Fachmann ausgehend von dem in K9/NK3/Da Silva beschriebenen CELP-Codiererkonzept in naheliegender Weise zum Gegenstand des Patentanspruchs 10 nach Hilfsantrag 1 gelangen sollte.

4.3.3

Auch ausgehend von einer der weiteren im Verfahren befindlichen Druckschriften aus dem Stand der Technik, die auch von den Klägerinnen nicht mehr aufgegriffen worden sind, ist nicht ersichtlich, wie der Fachmann in naheliegender Weise zum Gegenstand des Anspruchs 10 in der Fassung nach Hilfsantrag 1 gelangen sollte.

265 Insbesondere fehlt allen Druckschriften ein Hinweis auf eine Ersetzung der adaptiven Codebuch-Anregung durch eine Übergangsmodus-Anregung in mindestens einem Rahmen, der auf einen Übergangsrahmen in einem Schallsignal folgt gemäß dem Merkmal 10.1.1HA1.

4.3.4

Der Gegenstand des Patentanspruchs 10 gemäß Hilfsantrag 1 ist somit durch den im Verfahren befindlichen Stand der Technik weder bekannt noch nahegelegt.

5.

Die vorstehenden Ausführungen zum Anspruch 10 des Hilfsantrags 1 gelten in entsprechender Weise für die Gegenstände der nebengeordneten Vorrichtungsansprüche 1 und 20 sowie die Verfahrensansprüche 22, 29 und 38, die in Hilfsantrag 1 gegenüber dem Hauptantrag in entsprechender Weise geändert sind.Die genannten Patentansprüche erweisen sich damit ebenfalls als neu und als auf einer erfinderischen Tätigkeit beruhend. Auch die übrigen Ansprüche nach Hilfsantrag 1 erfüllen die an sie zu stellenden Anforderungen.

IV.

268 Die Kostenentscheidung beruht auf § 84 Abs. 2 PatG i. V. m. § 92 Abs. 1 ZPO.

269 Die ausgeurteilte Kostenquote entspricht dem Anteil des Obsiegens und Unterliegens der Parteien. Da der wirtschaftliche Wert, der dem Streitpatent aufgrund des nach dem Hilfsantrag 1 als schutzfähig verbleibenden Patentgegenstands gegenüber der geltenden Fassung noch zukommt, um ein Viertel reduziert ist, ist das Unterliegen der Beklagten mit 25 % und dementsprechend das der Klägerinnen mit 75 % zu bewerten.

270 Die Entscheidung über die vorläufige Vollstreckbarkeit folgt aus § 99 Abs. 1 PatG i. V. m. § 709 Satz 1 und Satz 2 ZPO.

V.

271 Der für das Patentnichtigkeitsverfahren gemäß § 2 Abs. 2 Satz 4 PatKostG i. V. m. §§ 63, 51 Abs. 1 GKG festzusetzende Streitwert war für die Nichtigkeitsklage der Klägerin zu 1 auf 375.000,-- Euro und für die Nichtigkeitsklage der Klägerin zu 2 auf 4.375.000,-- Euro festzusetzen.

1.

Der Streitwert im Patentnichtigkeitsverfahren ist gemäß §§ 51 Abs. 1, 63 Abs. 2 GKG nach billigem Ermessen zu bestimmen. Nach der ständigen Rechtsprechung des BGH ist dafür im Allgemeinen der gemeine Wert des Patents bei Erhebung der Nichtigkeitsklage zuzüglich des Betrags der bis dahin entstandenen Schadensersatzforderungen maßgeblich (vgl. BGH GRUR 2013, 1287, Rn. 3 – Nichtigkeitsstreitwert II; GRUR 2011, 757, Rn. 2 – Nichtigkeitsstreitwert I; GRUR 2009, 1100 – Druckmaschinen-Temperierungssystem III; GRUR 2007, 175 – Sachverständigenentschädigung IV; GRUR 1957, 79).

273 Bei der Festsetzung des Streitwerts für das Nichtigkeitsverfahren kann – sofern keine konkreten Anhaltspunkte zur Wertberechnung vorliegen – vom Streitwert eines auf das Streitpatent gestützten Verletzungsprozesses ausgegangen werden. Wenn im maßgeblichen Zeitpunkt der Erhebung der Nichtigkeitsklage mehrere Verletzungsverfahren wegen verschiedener Ausführungsformen anhängig sind, ist deren Streitwert zu addieren und anschließend wegen des Allgemeininteresses an einer möglichen Vernichtung des Patents um 25 % zu erhöhen (vgl. BGH GRUR 2011, 757 – Nichtigkeitsstreitwert I; BGH, Beschl. v. 16. Februar 2016, X ZR 110/13 m. w. N. – Grundsätze der Streitwertbemessung).Wertänderungen, die erst nach diesem Zeitpunkt eingetreten sind, sind dagegen grundsätzlich unerheblich (BGH GRUR 2022, 432 – Nichtigkeitsstreitwert IV).

2.

Ausgehend von diesen Grundsätzen war für die Nichtigkeitsklage der Klägerin zu 1 (führendes Verfahren 4 Ni 12/21 (EP)) ein Streitwert in Höhe von 375.000,-- Euro festzusetzen, da zum Zeitpunkt ihrer Erhebung (24. März 2020) zwei auf das Streitpatent gestützte Verletzungsverfahren vor dem Landgericht

München I (Az.: 7 O 14091/19) und vor dem Landgericht Mannheim (Az.

2 O 136/19)mit dortigen Streitwerten in Höhe von jeweils 150.000,-- Euro anhängig waren. Aus der Addition dieser Streitwerte der Verletzungsverfahren und der Erhöhung um den Regelaufschlag von 25 %errechnet sich der im Tenor genannte Nichtigkeitsstreitwert.

3.

Für die Nichtigkeitsklage der Klägerin zu 2 (hinzuverbundenes Verfahren4 Ni 27/22 (EP)) war der Streitwert endgültig auf 4.375.000,-- Euro festzusetzen, da im Zeitpunkt ihrer Erhebung (21. Januar2022) zwei auf das Streitpatent gestützte Verletzungsverfahren vor dem Landgericht München I anhängig waren, wobei der Streitwert in dem Verfahren 7 O 4396/21 mit Beschluss vom 26. Juli 2022 endgültig auf 2.500.000,-- Euro festgesetzt worden ist sowie im Verfahren 7 O 9609/21 ein Streitwert von 1.000.000,-- Euro angegeben wurde. Nicht zu berücksichtigen war dagegen das im rechtlichen Hinweis des Senats vom 14. September 2022 erwähnte Verletzungsverfahren 7 O 10630/21 mit einem Streitwert von 1.000.000,-- Euro, da dieses Verfahren nach den übereinstimmenden Angaben der Parteien in der mündlichen Verhandlung nicht das Streitpatent betraf.Aus der nach der höchstrichterlichen Rechtsprechung um den Regelaufschlag von 25 % zu erhöhenden Summe der zu berücksichtigenden Verletzungsstreitwerte errechnet sich der im Tenor genannte Nichtigkeitsstreitwert.

276 Dieser Streitwert entspricht auch mit Rücksicht auf den Vortrag der Klägerin zu 2 in der mündlichen Verhandlung billigem Ermessen im Sinne des § 51 Abs. 1 GKG.

277 Entgegen der Auffassung der Klägerin zu 2 vermag allein der Umstand, dass es sich bei dem Streitpatent um ein standardessentielles Patent handelt, für sich gesehen nicht eine Reduzierung des Streitwertes zu rechtfertigen (vgl. zur Frage der Erhöhung: BGH GRUR 2021, 1105, Rn. 15 – Nichtigkeitsstreitwert III). Denn der Umstand, dass es sich um ein Patent handelt, dessen Nutzung für den Zugang zu einem bestimmten Markt essentiell ist, findet in der Regel bereits bei der Festsetzung des Streitwerts im Verletzungsprozess Berücksichtigung. Die Festsetzung des Streitwerts im Verletzungsverfahren hat die Bedeutung des Klagepatents für den Absatz marktgängiger Produkte und die darauf zurückgehenden Umsatzerwartungen der Rechtsinhaberin zu berücksichtigen (BGH GRUR 2014, 206Rn. 16; GRUR 1985, 511, 512). Dieser Gesichtspunkt fließt – neben anderen – auch in eine der Streitwertermittlung dienende Lizenzprognose ein (BGH GRUR 2021, 1105, Rn. 16 – Nichtigkeitsstreitwert III; OLG Düsseldorf, NJOZ 2010, 2425; GRUR-RR 2011, 341).

4.

Trotz der Verbindung der Verfahren 4 Ni 12/21 (EP) und 4 Ni 27/22 (EP) zur gemeinsamen Verhandlung und Entscheidung werden die einzelnen Streitwerte nicht zusammengerechnet; im Verhältnis zur Beklagten bleibt für jede Nichtigkeitsklage der Streitwert maßgebend, der ihrem Umfang entspricht (vgl. Schulte, PatG, 11. Aufl. 2021, § 2 PatKostG, Rn. 52 m. w. N).

Wir verwenden optionale Cookies zu Analysezwecken. Mehr Infos in unserer Datenschutzerklärung.